В процессе серфинга часто попадаются сайты, на которых для совершения
каких-либо действий требуется ввести число/текст, изображенные на картинке.
Например, для
... [More]
скачивания файлов с rapidshare.de, или для отправки СМС
на мобильные телефоны билайна с сайта beeonline.ru ... Было бы здорово
иметь сервис, автоматически заносящий текст в соответствующие поля форм.
Как я себе это представляю?
Сервис состоит из двух частей - клиентской и серверной. Клиентская часть -
это незаметный виджет для Оперы, расширение для Firefox или ActiveX для IE.
Если в браузере в данный момент открыта страница, занесенная в таблицу
доступных для распознавания, то расширение пересылает картинку на свой
веб-сервис (серверная часть) и получает текстовый ответ, который
автоматически подставляет в соответствующее поле ввода. Таблица доступных
для распознавания страниц хранится на сервере, а клиенты периодически
синхронизируют с ней свои локальные копии. Если же страницы в таблице нет,
а картинка для распознавания на ней присутствует, то щелкнув по
соответствующей кнопке клиентской части можно отправить запрос на добавление
страницы в список распознаваемых. Наиболее популярные запросы получают свой
OCR (Optical Character Recognition) движок быстрее всего. Поскольку
OCR-часть полностью хранится на сервере, это позволяет
1.) оперативно реагировать на изменения в структуре картинок и т.п.
2.) гибко изменять правила пользования таким веб-сервисом ;-)
__________________________________________________
Соответственно, каждый участник проекта может принять участие в разработке
одной из пяти частей:
1. Серверное web-приложение (Perl)
2. OCR-компоненты
3. Active-X для MSIE(C++)
4. Extension для Firefox
5. Widget для Opera
На 18.12.2006 в проекте уже пять участников:
- Александр Котов, гр.5538
- Владимир Лоторейчик, гр.5539
- Андрей Жданов, гр.5539
- Николай Красильников, гр.5538
- Александр Кузнецов, гр.5539
Полезные ссылки:
- http://code.google.com/p/kott-ocr/ - Сайт проекта
- http://en.wikipedia.org/wiki/CAPTCHA - теоретическая информация по OCR
- http://www.captcha.ru/ - теоретическая информация по OCR
- http://my.opera.com/community/dev/widgets/ - как делать виджеты для Opera
- http://developer.mozilla.org/en/docs/Extensions - как делать экстеншны для Firefox
- http://www.codenet.ru/progr/visualc/ieplugin.php - как писать плагины к IE [Less]