Autor Tema: Quebrando Captchas en programa web  (Leído 6811 veces)

0 Usuarios y 5 Visitantes están viendo este tema.

Desconectado Jaru

  • The Communiter-
  • *
  • Mensajes: 13252
  • some text
Quebrando Captchas en programa web
« : abril 01, 2010, 02:37:41 pm »
vengo a los buenos svcianos programadores y pensadores elevados para ver si me pueden ayudar (o mejor aun, unirse a mi) para descifrar captchas por medio de algun metodo de programacion.

la idea es descifrar los captchas de la pagina de envio de mensajes de movistar [link] para poder enviar la form con el codigo del captcha incluido sin tener que introducirlo manualmente.

Si hay alguien por ahi que ya haya hecho esto de forma exitosa y en promedio util, pues se le agradecerá nos comparta su experiencia.

aqui hay ejemplos de lo que se debe romper.

He probado servicios web que reciben la imagen y regresan en texto lo descifrado, para evitar usar métodos externos, me gustaria algo propio, algo que pueda configurar e instalar en mi servidor web, de preferencia PHP o en PERL

« Última Modificación: abril 01, 2010, 02:39:56 pm por naruto »
N/A

Desconectado vlad

  • Global Moderator
  • The Communiter-
  • *
  • Mensajes: 6351
    • Qualium.net
Re:Quebrando Captchas en programa web
« Respuesta #1 : abril 01, 2010, 03:36:24 pm »
Telefonica es el mas facil, imagemagick y gocr hacen el truco, y esto quedo demostrado en sms.todosv.com en el que funciono por mas de 2 meses, la desventaja es que es una operacion intensiva para el CPU/RAM y mi PC no soportaba procesar tanto mensaje x_x

Ahorita solo estoy esperando tener listo un VPS para ponerlo a funcionar nuevamente, asi que telefonica puedo decir que esta
listo, el que esta mas dificil es el de Digicel que aun no logro mas del 25% de aciertos.

Respecto al codigo no lo publico porque siempre que pongo algo asi, a los 5 dias cambian el sistema los de telefonica x_x

Desconectado Jaru

  • The Communiter-
  • *
  • Mensajes: 13252
  • some text
Re:Quebrando Captchas en programa web
« Respuesta #2 : abril 01, 2010, 04:27:34 pm »
Telefonica es el mas facil, imagemagick y gocr hacen el truco, y esto quedo demostrado en sms.todosv.com en el que funciono por mas de 2 meses, la desventaja es que es una operacion intensiva para el CPU/RAM y mi PC no soportaba procesar tanto mensaje x_x

Ahorita solo estoy esperando tener listo un VPS para ponerlo a funcionar nuevamente, asi que telefonica puedo decir que esta
listo, el que esta mas dificil es el de Digicel que aun no logro mas del 25% de aciertos.

Respecto al codigo no lo publico porque siempre que pongo algo asi, a los 5 dias cambian el sistema los de telefonica x_x
yo el de digicel lo hago por email

ya vi a quien preguntarle por el código entonces :roll:
N/A

Desconectado vlad

  • Global Moderator
  • The Communiter-
  • *
  • Mensajes: 6351
    • Qualium.net
Re:Quebrando Captchas en programa web
« Respuesta #3 : abril 01, 2010, 05:37:22 pm »
yo el de digicel lo hago por email

ya vi a quien preguntarle por el código entonces :roll:
De hecho estoy mas que seguro que te lo envie, pero tu me dijiste que habias borrado ese MP :)

Desconectado Jaru

  • The Communiter-
  • *
  • Mensajes: 13252
  • some text
Re: Quebrando Captchas en programa web
« Respuesta #4 : noviembre 09, 2010, 10:48:31 am »
alguna solucion en PHP para reconocer caracteres?
N/A

Desconectado vlad

  • Global Moderator
  • The Communiter-
  • *
  • Mensajes: 6351
    • Qualium.net
Re: Quebrando Captchas en programa web
« Respuesta #5 : noviembre 09, 2010, 11:49:39 am »
nop, seria muy lento hacerlo en puro PHP. Lo que yo hacia era usar GOCR y usar en PHP exec() para llamarlo :)

Usaba Imagick para quitar el color gris de la imagen y listo!

Desconectado Jaru

  • The Communiter-
  • *
  • Mensajes: 13252
  • some text
Re: Quebrando Captchas en programa web
« Respuesta #6 : noviembre 09, 2010, 11:53:36 am »
mira pero como instalo GOCR  en un hosting que estoy pagando?
no se puede?
N/A

Desconectado vlad

  • Global Moderator
  • The Communiter-
  • *
  • Mensajes: 6351
    • Qualium.net
Re: Quebrando Captchas en programa web
« Respuesta #7 : noviembre 09, 2010, 12:08:53 pm »
He ahi el problema, solo podrias en un dedicado o en un VPS.

Yo lo que hacia era que desde sms.todosv.com enlazaba a la PC de mi casa, que mandaba el mensaje y solo le devolvia a sms.todosv.com si se envio o no.

El problema es que no aguanto la carga mi pobre conexion (hace unos 2 años, cuando era 512Kbps) y la mitad del tiempo pasabada colapsado.

Desconectado Jaru

  • The Communiter-
  • *
  • Mensajes: 13252
  • some text
Re: Quebrando Captchas en programa web
« Respuesta #8 : noviembre 09, 2010, 12:13:11 pm »
alguna solucion alterna?
N/A

Desconectado ENIGMAXG2

  • The Communiter-
  • *
  • Mensajes: 5766
Re: Quebrando Captchas en programa web
« Respuesta #9 : noviembre 09, 2010, 12:24:54 pm »
Yo he visto un sistema (en Linux, no se si estará para otros S.O.) que se llama Tesseract

http://es.wikipedia.org/wiki/Tesseract_OCR
#SaveMarvelHeroes
ZOTAC GTX1060 MINI 3GB | HDD 2 TB | CM 550W | Core i5-2400 3.1GHZ | Intel H61 MOBO | CORSAIR 8GB DDR3 1600 | AOC 2269W 1080p + Acer X163WL 768p | W8.1 PRO x64| Logitech Z506/TurtleBeach EarForce P11[/center

Desconectado vlad

  • Global Moderator
  • The Communiter-
  • *
  • Mensajes: 6351
    • Qualium.net
Re: Quebrando Captchas en programa web
« Respuesta #10 : noviembre 09, 2010, 01:40:57 pm »
El Tesseract tambien necesita ser instalado, por lo que conlleva el mismo problema que GOCR

Desconectado salvadoresc

  • Global Moderator
  • The Communiter-
  • *
  • Mensajes: 11652
  • Adobe Certified Expert en ACISEAPRENDE
    • Foro de Diseno - Pixeles al Desnudo
Re: Quebrando Captchas en programa web
« Respuesta #11 : noviembre 09, 2010, 02:56:06 pm »
que tantos recursos te gasta vlad?
Awaken my child, and embrace the glory that is your birthright. Know that I am the Overmind; the eternal will of the Swarm.

haycoctelesamor.com

Desconectado vlad

  • Global Moderator
  • The Communiter-
  • *
  • Mensajes: 6351
    • Qualium.net
Re: Quebrando Captchas en programa web
« Respuesta #12 : noviembre 09, 2010, 03:09:14 pm »
que tantos recursos te gasta vlad?

Aprox. 5MB de RAM (gocr+imagick+proceso de php) y 15KB por cada segundo que dure el envio.

El problema es que por la latencia de las conexiones y mi ancho de banda se llegaban a amontonar hasta 100 envios simultaneos, ocupando 500MB de RAM ya mi conexion de 0.5MB no podia dar abasto a los 1.5MB necesarios constantemente de ancho de banda.

Cuando llego a 26K visitas diarias colapsaba cada media hora o cada hora la pobre maquina.



Desconectado salvadoresc

  • Global Moderator
  • The Communiter-
  • *
  • Mensajes: 11652
  • Adobe Certified Expert en ACISEAPRENDE
    • Foro de Diseno - Pixeles al Desnudo
Re: Quebrando Captchas en programa web
« Respuesta #13 : noviembre 09, 2010, 03:58:14 pm »
y no hay alguna forma que identifiques los captchas y la almacenes en base da datos para no tener que estar usando el ocr cada ves... asi las que ya fueron identificadas no tengan que ser identificadas de nuevo creo que asi podrias reducirle carga al server solo seria las primeras veces las que requeriria hacer el procedimiento.

el captcha no trae algun nombre de imagen o alguna variable con la que se pueda identificar cuando vuelve a salir la misma
Awaken my child, and embrace the glory that is your birthright. Know that I am the Overmind; the eternal will of the Swarm.

haycoctelesamor.com

Desconectado ENIGMAXG2

  • The Communiter-
  • *
  • Mensajes: 5766
Re: Quebrando Captchas en programa web
« Respuesta #14 : noviembre 09, 2010, 04:03:34 pm »
el captcha no trae algun nombre de imagen o alguna variable con la que se pueda identificar cuando vuelve a salir la misma

Calculando el Hash o MD5 podría ser (lo que hace el ares pues, que identifica varias fuentes de un archivo aunque haya gente que lo tiene con nombres distintos).
#SaveMarvelHeroes
ZOTAC GTX1060 MINI 3GB | HDD 2 TB | CM 550W | Core i5-2400 3.1GHZ | Intel H61 MOBO | CORSAIR 8GB DDR3 1600 | AOC 2269W 1080p + Acer X163WL 768p | W8.1 PRO x64| Logitech Z506/TurtleBeach EarForce P11[/center