РЕКЛАМА

Загрузка...
' />

Пользователи интернета невольно помогут оцифровать миллионы книг

Пользователи интернета могут помочь в переводе в электронную форму миллионов книг, не подозревая о собственном участии в этом проекте, пишут исследователи из американского университета Карнеги-Меллон в статье, опубликованной в журнала Science.
Пользователи интернета невольно помогут оцифровать миллионы книг
Крупные проекты по оцифровке книг, которые позволяют сохранить информацию и сделать ее доступной для миллионов интернет-пользователей, наталкиваются на проблему несовершенства программного обеспечения, распознающего печатный текст.

"В старых книгах с выцветшей краской и пожелтевшими страницами программы распознавания текста (OCR) не могут расшифровать около 20% слов", - пишут авторы.

Точность человека как "инструмента" распознавания текста достигает 99%. "К несчастью, привлечение людей-расшифровщиков обходится очень дорого, так что вручную переводятся в цифровую форму только документы исключительной важности", - говорится в статье.

Ученые из Карнеги-Меллона предлагают использовать для расшифровки слов, неправильно распознанных программой, пользователей интернета, которые каждый день вводят в формах авторизации намеренно искаженные слова на картинках, доказывая, что они люди, а не роботы.

Технология CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart ) была разработана в 2000 году. Она призвана определить, человек или компьютер пользуется системой, с помощью задач, которые может решить только человек, но не программа.

Одна из наиболее распространенных форм этого теста состоит в том, что пользователю предлагается прочесть и ввести слово, изображенное на картинке намеренно искаженными буквами.

CAPTCHA используется, чтобы предотвратить использование интернет-сервисов роботами, в частности, для предотвращения автоматических отправки сообщений, регистрации, скачивания файлов, массовых рассылок.

По данным авторов статьи, люди по всему миру проходят каждый день более 100 миллионов тестов CAPTCHA, тратя в каждом случае несколько секунд на распознавание намеренно искаженных символов.

Созданная учеными технология reCAPTCHA позволяет получать полезный результат - оцифрованные книги. Программа в ходе эксперимента была размещена на 40 тысячах сайтов, которые нуждались в отделении людей от роботов. Каждый пользователь, проходивший тест, получал картинку со словом из книги, неверно распознанным программой, а также контрольное слово. Если пользователь верно распознавал контрольное слово, программа считала, что и слово из книги он распознал верно.

"Точность системы reCAPTCHA достигала 99,1% (216 ошибок на 24 тысячи 80 слов), в то время как точность программ распознавания текстов достигала лишь 83,5% (3 тысячи 976 ошибок)", - говорится в статье.

Авторы технологии отмечают, что созданная ими система выгодна для владельцев сайтов еще и более высоким уровнем безопасности, так как в тесте используются слова, заведомо неверно распознанные автоматическими средствами - следовательно и роботы их распознать не смогут.
0
1409
12 сентября 2008
Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь. Мы рекомендуем Вам зарегистрироваться либо зайти на сайт под своим именем.
Смотрите также
Самые сумасшедшие CAPTCHAСамые сумасшедшие CAPTCHA

CAPTCHA (от англ. «Completely Automated Public Turing test to tell Computers and Humans Apart» — полностью автоматизированный публичный тест Тьюринга...

Как спам помогает в создании искусственного интеллектаКак спам помогает в создании искусственного интеллекта

Как пользователь разнообразных интернет-ресурсов каждый из нас не раз проходил тест CAPTCHA (от англ. «Completely Automated Public Turing test to tell...

Разработана новая система ввода текста на мобильникахРазработана новая система ввода текста на мобильниках

Клифф Кашлер, разработчик популярной системы мобильного ввода текстов T9, применяемой на подавляющем большинстве современных мобильных телефонов, созд...

Решение избирателя можно узнать раньше него самого - ученыеРешение избирателя можно узнать раньше него самого - ученые

Будущее решение избирателя можно предсказать до того, как он сам определится, за кого хочет голосовать, опираясь на знание о его неосознанных предпочт...

Загрузка...
Посетители, находящиеся в группе Гости, не могут оставлять комментарии в данной новости.
Четверг, 30 Марта
USD 1.8767
EUR 2.0242
RUB 0.0329
Новости от партнеров
Сейчас на сайте
4 пользователя, 2125 гостей