РЕКЛАМА

Загрузка...
' />

Пользователи интернета невольно помогут оцифровать миллионы книг

Пользователи интернета могут помочь в переводе в электронную форму миллионов книг, не подозревая о собственном участии в этом проекте, пишут исследователи из американского университета Карнеги-Меллон в статье, опубликованной в журнала Science.
Пользователи интернета невольно помогут оцифровать миллионы книг
Крупные проекты по оцифровке книг, которые позволяют сохранить информацию и сделать ее доступной для миллионов интернет-пользователей, наталкиваются на проблему несовершенства программного обеспечения, распознающего печатный текст.

"В старых книгах с выцветшей краской и пожелтевшими страницами программы распознавания текста (OCR) не могут расшифровать около 20% слов", - пишут авторы.

Точность человека как "инструмента" распознавания текста достигает 99%. "К несчастью, привлечение людей-расшифровщиков обходится очень дорого, так что вручную переводятся в цифровую форму только документы исключительной важности", - говорится в статье.

Ученые из Карнеги-Меллона предлагают использовать для расшифровки слов, неправильно распознанных программой, пользователей интернета, которые каждый день вводят в формах авторизации намеренно искаженные слова на картинках, доказывая, что они люди, а не роботы.

Технология CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart ) была разработана в 2000 году. Она призвана определить, человек или компьютер пользуется системой, с помощью задач, которые может решить только человек, но не программа.

Одна из наиболее распространенных форм этого теста состоит в том, что пользователю предлагается прочесть и ввести слово, изображенное на картинке намеренно искаженными буквами.

CAPTCHA используется, чтобы предотвратить использование интернет-сервисов роботами, в частности, для предотвращения автоматических отправки сообщений, регистрации, скачивания файлов, массовых рассылок.

По данным авторов статьи, люди по всему миру проходят каждый день более 100 миллионов тестов CAPTCHA, тратя в каждом случае несколько секунд на распознавание намеренно искаженных символов.

Созданная учеными технология reCAPTCHA позволяет получать полезный результат - оцифрованные книги. Программа в ходе эксперимента была размещена на 40 тысячах сайтов, которые нуждались в отделении людей от роботов. Каждый пользователь, проходивший тест, получал картинку со словом из книги, неверно распознанным программой, а также контрольное слово. Если пользователь верно распознавал контрольное слово, программа считала, что и слово из книги он распознал верно.

"Точность системы reCAPTCHA достигала 99,1% (216 ошибок на 24 тысячи 80 слов), в то время как точность программ распознавания текстов достигала лишь 83,5% (3 тысячи 976 ошибок)", - говорится в статье.

Авторы технологии отмечают, что созданная ими система выгодна для владельцев сайтов еще и более высоким уровнем безопасности, так как в тесте используются слова, заведомо неверно распознанные автоматическими средствами - следовательно и роботы их распознать не смогут.
0
1429
12 сентября 2008
Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь. Мы рекомендуем Вам зарегистрироваться либо зайти на сайт под своим именем.
Смотрите также
Самые сумасшедшие CAPTCHAСамые сумасшедшие CAPTCHA

CAPTCHA (от англ. «Completely Automated Public Turing test to tell Computers and Humans Apart» — полностью автоматизированный публичный тест Тьюринга...

Как спам помогает в создании искусственного интеллектаКак спам помогает в создании искусственного интеллекта

Как пользователь разнообразных интернет-ресурсов каждый из нас не раз проходил тест CAPTCHA (от англ. «Completely Automated Public Turing test to tell...

Разработана новая система ввода текста на мобильникахРазработана новая система ввода текста на мобильниках

Клифф Кашлер, разработчик популярной системы мобильного ввода текстов T9, применяемой на подавляющем большинстве современных мобильных телефонов, созд...

Решение избирателя можно узнать раньше него самого - ученыеРешение избирателя можно узнать раньше него самого - ученые

Будущее решение избирателя можно предсказать до того, как он сам определится, за кого хочет голосовать, опираясь на знание о его неосознанных предпочт...

Загрузка...
Посетители, находящиеся в группе Гости, не могут оставлять комментарии в данной новости.
Вторник, 23 Мая
USD 1.8525
EUR 2.0713
RUB 0.0328
BartS 20 минут назад "Они же дети!" glum 21 минут назад Бананов, очепятки уже в заголовках
Mab 23 минут назад
Цитата: Margasan
Он говорил, что увольняясь (к тому времени сменил штук пять работ) всё время "хлопает дверью", чтобы все связи рвались основательно и навсегда.

Зависит от того по какой причине увольнение.
Bal 27 минут назад Гамно Lucya 30 минут назад patrokl,
Спасибо, приятно видеть рассудительных людей, а не истеричек с наклонностями бородочей.
Margasan 30 минут назад Поддерживаю.
Цитата: Mab
Полностью поддерживаю.
Нужно не просто зайти в Европу, а и крепко закрыть за собой двери в постсоветское пространство
Не знаю откуда у вас цитата, но вспомнился один знакомый мой. Он говорил, что увольняясь (к тому времени сменил штук пять работ) всё время "хлопает дверью", чтобы все связи рвались основательно и навсегда.
Bolik 36 минут назад ...дайте моим детям..а лучше по 2 сразу...
задолбали их разбивать..
Vadik_K 39 минут назад Mab, педота, да, 365. А в високосном 366 партнёров. Так что бери калькулятор и считай.
Блин я понимаю, что для тебя пососать письку это как чаю попить, но учти, что не все такие долбоёбы как ты.
Новости от партнеров
Сейчас на сайте
46 пользователей, 1645 гостей