Владимир Берлизов (студия "ВИТ"), наш сайт: http://studiavit.com/

Наши телефоны: 067-480-59-22 и 067-484-44-33

Наша группа Вконтакте здесь
Наша группа на Facebook здесь
Также, Вы можете посмотреть видео-работы студии "ВИТ" здесь, а фотографии здесь.

Иногда возникает желание поделиться своими мыслями или просто показать больше работ, чем выложено на нашем основном сайте... Заглядывайте, постараюсь сделать так, чтобы вам здесь не было скучно.
Ваш, Владимир Берлизов.

Справа находится список ярлыков, если вас интересует какой-нибуть конкретный раздел блога, щёлкните по соответствующему ярлыку.

Приятного просмотра!

четверг, 9 июня 2011 г.

Как работает reCAPTCHA?

По своей сущности, reCAPTCHA выполняет ту же функцию, которую выполняют другие капчи. Суть проста, вводим предложенный текст и тем самым доказываем, что мы не робот. Главным отличием от других систем является то, что reCAPTCHA не только защищает сайт от спамеров, но еще и выполняет другую, достаточно интересную функцию.
reCAPTCHA предлагает ввести два слова, что практически не встречается у других капч. Суть в том, что пользователь при вводе этих слов не только доказывает, что он человек, но еще и помогает распознавать старые книги и газеты.


 Принцип работы прост:
 Допустим, есть энная книга, которая сохранилась в малом количестве экземпляров, при этом все они в плохом состоянии. Один экземпляр в отсканированном виде попал в руки Google (владелец reCAPTCHA). Что с ним делать? Правильно, цифровать. Как цифровать? Цифровать, используя системы распознавания символов (OCR). Но, как многим известно, эти системы очень часто грешат многочисленными ошибками в выданном результате. Вручную перебирать весь текст на предмет ошибок — слишком дорогое удовольствие. И вот, на помощь приходит reCAPTCHA. Одно слово в изображении распозналось системой OCR правильно, а вот второе никак нет. Второе слово — за пользователем, именно то, что он введет будет использовано в качестве замены ошибочному варианту, предложенным OCR.  Каждое непонятное для OCR слово reCAPTCHA показывает пользователям сотни, а то и тысячи раз (при цифре в 200 миллионов генераций в день это очень мало), и в конечном итоге правильным считается тот вариант, который пользователи вводили чаще всего.
Есть люди, которые критикуют reCAPTCHA, и с этической точки зрения, критикуют они не зря. Дело в том, что за распознанный текст Google так или иначе получает деньги. А сами тексты добываются вполне себе бесплатно, силами пользователей. То есть, тут имеет место бесплатный труд. Лично меня это не волнует, к тому же, никто не заставляет пользователей вводить reCAPTCHA, и более того, никто не заставляет веб-мастеров устанавливать ее на свои сайты :)

Комментариев нет: