![](https://img-fotki.yandex.ru/get/135639/137106206.6a4/0_1c5986_83dfdfd2_orig)
Вот тут роботы
ходят на двух ногах, носят ящики и открывают двери, вот тут робот
победил человека в Го, а вот тут
обманул его в общении. Что ждать от него дальше? Да вот пожалуйста:
Исследователи из Университета будущего Хакодате с помощью искусственного интеллекта написали роман, который прошел в финал литературной премии имени Хоси Синъити. Объявление победителей и вручение призов состоялось еще 12 марта, однако различные издания обратили внимание на это событие только сейчас.
Давайте посмотрим, как так получилось ...
![](http://img-fotki.yandex.ru/get/5008/137106206.459/0_ec15c_1ece3304_orig)
подробнее
про этот старинный автомат тутНабор входных данных, определенный учеными заранее, включал в себя пол главных персонажей, описание сюжета, а также набор фраз и предложений, которые должны были быть использованы при написании произведения. После этого программа самостоятельно сгенерировала текст романа, получившего название «День, когда компьютер напишет роман». Других подробностей о работе алгоритма не сообщается.
Текст романа выдвинут для участия в литературном конкурсе имени японского фантаста Хоси Синъити, и был был принят на рассмотрение жюри. Из 1450 работ, поданных на конкурс, 11 были написаны с помощью различных программ, генерирующих текст, однако после четырех этапов отсева только один написанный с помощью искусственного интеллекта роман прошел финальный отбор. При этом членам жюри было неизвестно, что автор роман «робот-писатель».
По словам японского писателя Хасэ Сатоси, роман «День, когда компьютер напишет роман» достаточно хорошо написан. Тем не менее, писатель отметил некоторые недостатки в тексте, написанном машиной — в частности, плохую проработку персонажей.
Это не первый случай, когда робот используется для написания качественного текста. Ранее компания
Automated Insights открыла бесплатный доступ к бета-версии сервиса «робота-журналиста» Wordsmith, который позволяет создавать на основе массивов данных короткие заметки, написанные естественным языком.
Вот еще интересный пример.![](https://img-fotki.yandex.ru/get/50260/137106206.6a4/0_1c57ed_245e3cab_orig)
Скот Хорсли состязается с роботом. Источник: An NPR Reporter Raced A Machine To Write A News Story. Who Won? NPR, May 29, 2015
В мае 2015 года Скотт Хорсли (Scott Horsley), корреспондент NPR в Белом доме и бывший бизнес-журналист, бросил дерзкий вызов пишущему алгоритму Wordsmith компании Automated Insights. «Мы хотели узнать, –
пишет NPR, – как наше лучшее перо покажет себя против машины». Поскольку NPR – радио, то био-журналист был достаточно тренирован для быстрого письма. По условиям соревнования, оба противника должны были дождаться публикации финансового отчета сети кафе Denny’s и – вперед. Причем у Скота было преимущество – ведь он был постоянным клиентом Denny’s. У него там даже была любимая официантка, Женевьев, которая знала наизусть его заказ: сэндвич из яичницы с беконом. Не помогло. Хотя… как судить.
Робот управился за две минуты, Скот Хорсли – за семь с небольшим. NPR публикует обе заметки и предлагает читателю своего рода
тест Тьюринга – определить, какой текст сгенерирован роботом, а какой – человеком.
![](https://img-fotki.yandex.ru/get/56941/137106206.6a4/0_1c57f6_922f2c92_orig)
Журналистский «тест Тьюринга». Источник: An NPR Reporter Raced A Machine To Write A News Story. Who Won? NPR, May 29, 2015
Робот написал, конечно же, левую заметку. В ней очевидно выше плотность цифр, и она суше по стилю. Тогда как Скот, вспомнив то ли меню, то ли Женевьев, подпустил немного необязательной для финансового отчета лирики. Например, вставил фразу: «Рост продаж показывает, что потребители не прочь раскрыть свои бумажники ради блинчиков, яиц и картофельных оладий».
Формально словарь робота больше, поскольку должен включать в себя весь словарный запас языка (это свыше 1 млн слов для английского языка). Словарь образованного англоговорящего человека может достигать 100 тысяч слов. Но робот должен использовать наиболее частотные слова, что и делает его язык «суше». Кроме того, словарь этого робота ограничен еще и финансовой специализацией. Ему и «в голову» не могло прийти, что можно использовать в финансовом отчете кулинарные или спортивные названия (grand slam). Человек же, наоборот, частотностью не ограничен и волен использовать сколь угодно редкие и вычурные слова, расширяя контекст и образность. Более того, человек-писатель потому и писатель, что использует оригинальные образы. Роботу для финансового отчета это просто не нужно.
“But that could change”, это может измениться, – пишет NPR. Если хозяин решит скормить Wordsmith массивы более раскованных текстов NPR и слегка подкрутит алгоритм, то «Словесный кузнец» быстро перестроит свою лексику, точнее – расширит границы и принципы ее применения. Это все настраивается.
Кто победил в соревновании? Робот написал быстрее, деловитее. Скот Хорсли, как это ни банально, – медленнее, но человечнее. Аудитория этой заметки – финансисты. Ценна ли для них лирическая вставка про кошельки и блинчики? Покуда читатели еще люди, а не роботы, то, наверное, да, ценна.
![](https://img-fotki.yandex.ru/get/55905/137106206.6a4/0_1c58cc_73ca26c_orig)
В общем, ничья. Хотя две минуты против семи… Для радио, для новостей финансового рынка – это может оказаться критично.
Есенинское состязание жеребенка с паровозом проводилось и в академической среде. В 2012 году Кристер Клирвал (Christer Clerwall), профессор медиа и коммуникаций из университета Карлстад, Швеция, попросил 46 студентов прочитать два спортивных отчета – один написанный роботом, и один – человеком. Человеческая заметка была сокращена до размеров роботической, но и роботическая слегка поправлена редактором: заголовок, лид, первые абзацы – как это обычно делает редактор в СМИ. Студентам было поручено оценить материалы по ряду критериев: объективность, доверие, аккуратность, занудность, интересность, ясность, удовольствие читать, полезность, цельность и т.п.
Результаты показали, что одна заметка выигрывала в одних параметрах, другая – в других. Человеческий текст получил больше баллов по критериям «хорошо написано», «приятно читать». Роботический текст, тоже предсказуемо, получил больше баллов по критериям «объективность», «четкое описание», «аккуратность» и т.п. То есть снова ничья.
Но самое главное, что
выявило исследование шведского профессора, – что различия между средним текстом био-журналиста и средним текстом кибер-журналиста незначительны. Это критически важный фактор для оценки будущего и уже настоящего робото-журналистики. Кибер-скептики все время говорят, что робот не может написать лучше человека. Но это неверный подход. «А может, заметке робота не обязательно быть «лучше»? Что если она будет просто достаточно хорошей?» – делится профессор Клирвал своими
опасениями с Wired.
А как вам такая история.Это землетрясение вошло в историю журналистики. 17 марта 2014 года в 6.25 утра журналист и программист The Los Angeles Times Кен Швенке (Ken Schwencke) был разбужен подземными толчками. Он подбежал к компьютеру, где в издательской системе его уже ожидала заметка, написанная его алгоритмом Quakebot. Кен пробежал заметку глазами и нажал кнопку «Опубликовать».
Так LAT стала первым СМИ, написавшем о землетрясении, – через 3 минуты после толчка. Робот-журналист опередил своих био-коллег.
![](https://img-fotki.yandex.ru/get/52325/137106206.6a4/0_1c5833_ea976b25_orig)
Первая заметка о землетрясении, написанная роботом. Источник: The First News Report on the L.A. Earthquake Was Written by a Robot. By Will Oremus. Slate, March 17, 2014
Вот эта заметка на сайте LAТ, дополненная через час после повторного толчка. Она подписана именем Швенке, но в конце указано: «this post was created by an algorithm written by the author.»
Алгоритм Quakebot, написанный Кеном Швенке, к тому времени существовал уже два года. Quakebot подключен к ленте американской службы геомониторинга. Из нее он мгновенно берет исходные данные – место, время, амплитуду, сравнивает эти данные с предыдущими землетрясениями в этом районе, тем самым автоматически определяя историческую значимость события. Данные помещаются в подходящий шаблон, и заметка готова. Робот загружает ее в издательскую систему и посылает редактору уведомление. На Пулитцера заметка явно не тянет, зато редактор уже через несколько минут после события имеет готовую публикацию. Остается добавить, что землетрясения входят в перечень горячих новостей Лос-Анджелеса. На сайте Los Angeles Times есть целый
раздел Earthquakes, который пополняется роботом-юнкором.
В той же Los Angeles Times робот ведет и другую рубрику – криминальную хронику
Homicide Report, причем с 2007 (!) года. Как только полицейский coroner вывешивает в свою базу (она, очевидно, публична) рапорт о чьей-то насильственной смерти, робот берет все данные, помещает их на карту, относит к категориям по расе, полу, причине смерти, участии полицейских и т.п., и публикует заметку с простенькой шаблонной формулировкой в ленту. Далее, если событие того заслуживает, журналист добирает информацию и дописывает развернутую криминальную заметку. А если нет – то нет.
источники
https://nplus1.ru/news/2016/03/25/novel-machine - Николай Воронцов
http://texterra.ru/blog/roboto-zhurnalistika-vkalyvayut-roboty-schastliv-chelovek.html
http://the-japan-news.com/news/article/0002826970