РЕКЛАМА

Загрузка...
' />

Пользователи интернета невольно помогут оцифровать миллионы книг

Пользователи интернета могут помочь в переводе в электронную форму миллионов книг, не подозревая о собственном участии в этом проекте, пишут исследователи из американского университета Карнеги-Меллон в статье, опубликованной в журнала Science.
Пользователи интернета невольно помогут оцифровать миллионы книг
Крупные проекты по оцифровке книг, которые позволяют сохранить информацию и сделать ее доступной для миллионов интернет-пользователей, наталкиваются на проблему несовершенства программного обеспечения, распознающего печатный текст.

"В старых книгах с выцветшей краской и пожелтевшими страницами программы распознавания текста (OCR) не могут расшифровать около 20% слов", - пишут авторы.

Точность человека как "инструмента" распознавания текста достигает 99%. "К несчастью, привлечение людей-расшифровщиков обходится очень дорого, так что вручную переводятся в цифровую форму только документы исключительной важности", - говорится в статье.

Ученые из Карнеги-Меллона предлагают использовать для расшифровки слов, неправильно распознанных программой, пользователей интернета, которые каждый день вводят в формах авторизации намеренно искаженные слова на картинках, доказывая, что они люди, а не роботы.

Технология CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart ) была разработана в 2000 году. Она призвана определить, человек или компьютер пользуется системой, с помощью задач, которые может решить только человек, но не программа.

Одна из наиболее распространенных форм этого теста состоит в том, что пользователю предлагается прочесть и ввести слово, изображенное на картинке намеренно искаженными буквами.

CAPTCHA используется, чтобы предотвратить использование интернет-сервисов роботами, в частности, для предотвращения автоматических отправки сообщений, регистрации, скачивания файлов, массовых рассылок.

По данным авторов статьи, люди по всему миру проходят каждый день более 100 миллионов тестов CAPTCHA, тратя в каждом случае несколько секунд на распознавание намеренно искаженных символов.

Созданная учеными технология reCAPTCHA позволяет получать полезный результат - оцифрованные книги. Программа в ходе эксперимента была размещена на 40 тысячах сайтов, которые нуждались в отделении людей от роботов. Каждый пользователь, проходивший тест, получал картинку со словом из книги, неверно распознанным программой, а также контрольное слово. Если пользователь верно распознавал контрольное слово, программа считала, что и слово из книги он распознал верно.

"Точность системы reCAPTCHA достигала 99,1% (216 ошибок на 24 тысячи 80 слов), в то время как точность программ распознавания текстов достигала лишь 83,5% (3 тысячи 976 ошибок)", - говорится в статье.

Авторы технологии отмечают, что созданная ими система выгодна для владельцев сайтов еще и более высоким уровнем безопасности, так как в тесте используются слова, заведомо неверно распознанные автоматическими средствами - следовательно и роботы их распознать не смогут.
0
1403
12 сентября 2008
Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь. Мы рекомендуем Вам зарегистрироваться либо зайти на сайт под своим именем.
Смотрите также
Самые сумасшедшие CAPTCHAСамые сумасшедшие CAPTCHA

CAPTCHA (от англ. «Completely Automated Public Turing test to tell Computers and Humans Apart» — полностью автоматизированный публичный тест Тьюринга...

Как спам помогает в создании искусственного интеллектаКак спам помогает в создании искусственного интеллекта

Как пользователь разнообразных интернет-ресурсов каждый из нас не раз проходил тест CAPTCHA (от англ. «Completely Automated Public Turing test to tell...

Разработана новая система ввода текста на мобильникахРазработана новая система ввода текста на мобильниках

Клифф Кашлер, разработчик популярной системы мобильного ввода текстов T9, применяемой на подавляющем большинстве современных мобильных телефонов, созд...

Решение избирателя можно узнать раньше него самого - ученыеРешение избирателя можно узнать раньше него самого - ученые

Будущее решение избирателя можно предсказать до того, как он сам определится, за кого хочет голосовать, опираясь на знание о его неосознанных предпочт...

Загрузка...
Посетители, находящиеся в группе Гости, не могут оставлять комментарии в данной новости.
Суббота, 25 Февраля
USD 1.8774
EUR 1.9875
RUB 0.0324
gismo_2 2 минут назад
Цитата: 3ara3a
Парковал свой говно сайт??? на А..
С тобой все мне ясно )))

=))) Чудак, а зачем нужно больше если на домене один сервер со статическим айпишником?

Так че там по безопасности тимвьювера и иксам на винде? В чем проблемы? Знаешь как иксы работают?
3ara3a 4 минут назад
Цитата: gismo_2
Да и последний раз когда я привязывал домен к айпишнику мне достаточно было A-записи.
Парковал свой говно сайт??? на А..
С тобой все мне ясно )))

Отдыхай. гуглевское лошье ssh на иксы ))vnc пох ))
gismo_2 16 минут назад
Цитата: 3ara3a
Если бы в конце 90-ых ты зубами клал даже не витую пару где нить на Серебрянке в Сильвернет или в Уручье U2 или в зеленом луге.. Да бухал на сисопках на Слоне у Филы..

Клал Сильверадо, сеть была такая в серебрянке, нахер там доменное имя вообще? Опять же Full Qualified Domain Name нужно для резолвинга айпишника в сетях где одному айпишнику и доменному имени соответствует несколько серверов. Нахер он в домашней сети? Че ты несешь? Да и последний раз когда я привязывал домен к айпишнику мне достаточно было A-записи.
3ara3a 22 минут назад
Цитата: gismo_2

Без понятия, никогда этим не занимался. И уж точно не буду напрягаться ища это в гугле.
Зато мое предположение подтвердилось, Зараза таки одмин.

Если бы в конце 90-ых ты зубами клал даже не витую пару где нить на Серебрянке в Сильвернет или в Уручье U2 или в зеленом луге.. Да бухал на сисопках на Слоне у Филы.. Говно айчины еще не было.. ТЫ бы тоже. типа сисадмином был. и BGP IS-IS как родная ))
gismo_2 24 минут назад
Цитата: 3ara3a
Погуглил и просрался?? )) я то в теме )) ОК спрошу интереснее как правильно настроить в домене суфикс мастер зоны допусти klizma.com дабы в nslookup таймаута не было при расшерение FQDN ? Вот и проверим тебя )) Гуглевский лох ))

Без понятия, никогда этим не занимался. И уж точно не буду напрягаться ища это в гугле.
Зато мое предположение подтвердилось, Зараза таки одмин.

Цитата: 3ara3a
GPO для тимвьювера , контроль доступа уровня АД )

А вот и подтверждение, что виндузятник.
Цитата: 3ara3a
ТИм лидер . Занимайся лучше свои говнокодом для андройда ))

Вообще не пишу под андроид. Да и Джаву не люблю.

Так че там про безопасность тимвьювера, одмин-недоучка?
3ara3a 52 минут назад
Цитата: gismo_2
Получение отладочных сведений, это то чем ты гордишься?

Погуглил и просрался?? )) я то в теме )) ОК спрошу интереснее как правильно настроить в домене суфикс мастер зоны допусти klizma.com дабы в nslookup таймаута не было при расшерение FQDN ? Вот и проверим тебя )) Гуглевский лох ))

Цитата: gismo_2

Ну впн - нормуль. Но удаленный помощник - это абассака. Особенно под win7. По ходу Зараза у нас ламер одмин-виндузятник.
По-моему у Майкрософт не было более дырявого софта чем RDP клиент "удаленный помошник"
(прим. орфография и пунктуация автора сохранена)

Ты вообще знаешь, что такое RDP клиент? И уж точно обоссака сравнивать Удаленный помощник и Тимвьювер, утверждая что последний менее годный чем первый.
GPO для тимвьювера , контроль доступа уровня АД )

Короче ясно )))

ТИм лидер . Занимайся лучше свои говнокодом для андройда ))
gismo_2 62 минут назад
Цитата: 3ara3a
nslookup -d2

Получение отладочных сведений, это то чем ты гордишься?

Цитата: 3ara3a
Обосраться ))) ТЫ под мамкой бегал когда я netwag под cygwin на винде ))))))

Когда я, когда я... Я - самая последняя буква в алфавите.
Цитата: 3ara3a
А тимьювер в корпоративной среде - зло.

С какого перепугу ты решил что серваки универа - корпоративная среда?
Цитата: 3ara3a
Есть ВПН + удаленный помошник ))

Ну впн - нормуль. Но удаленный помощник - это абассака. Особенно под win7. По ходу Зараза у нас ламер одмин-виндузятник.
По-моему у Майкрософт не было более дырявого софта чем RDP клиент "удаленный помошник"
(прим. орфография и пунктуация автора сохранена)

Ты вообще знаешь, что такое RDP клиент? И уж точно обоссака сравнивать Удаленный помощник и Тимвьювер, утверждая что последний менее годный чем первый.
3ara3a 71 минут назад
Цитата: gismo_2
lol Зараза, ты лопух, видимо такой старый, что не в курсе, что тимвьювер как клиент так и сервер есть под все.
https://www.teamviewer.com/ru/download/mac/

А про Cygwin и minGW наверное вообще никогда не слышал. Вот уж где точно ламье.
Обосраться ))) ТЫ под мамкой бегал когда я netwag под cygwin на винде )))))) А тимьювер в корпоративной среде - зло. Есть ВПН + удаленный помошник ))
Новости от партнеров

ИНТЕРЕСНОЕ:

Загрузка...
Сейчас на сайте
38 пользователей, 2594 гостя