Робот - писатель

25.03.2016, 17:27,
Наука и технологии

Просмотров: 6 160

Вот тут роботы ходят на двух ногах, носят ящики и открывают двери, вот тут робот победил человека в Го, а вот тут обманул его в общении. Что ждать от него дальше? Да вот пожалуйста:

Исследователи из Университета будущего Хакодате с помощью искусственного интеллекта написали роман, который прошел в финал литературной премии имени Хоси Синъити. Объявление победителей и вручение призов состоялось еще 12 марта, однако различные издания обратили внимание на это событие только сейчас.

Давайте посмотрим, как так получилось ...

подробнее про этот старинный автомат тут

Набор входных данных, определенный учеными заранее, включал в себя пол главных персонажей, описание сюжета, а также набор фраз и предложений, которые должны были быть использованы при написании произведения. После этого программа самостоятельно сгенерировала текст романа, получившего название «День, когда компьютер напишет роман». Других подробностей о работе алгоритма не сообщается.

Текст романа выдвинут для участия в литературном конкурсе имени японского фантаста Хоси Синъити, и был был принят на рассмотрение жюри. Из 1450 работ, поданных на конкурс, 11 были написаны с помощью различных программ, генерирующих текст, однако после четырех этапов отсева только один написанный с помощью искусственного интеллекта роман прошел финальный отбор. При этом членам жюри было неизвестно, что автор роман «робот-писатель».

По словам японского писателя Хасэ Сатоси, роман «День, когда компьютер напишет роман» достаточно хорошо написан. Тем не менее, писатель отметил некоторые недостатки в тексте, написанном машиной — в частности, плохую проработку персонажей.

Это не первый случай, когда робот используется для написания качественного текста. Ранее компания Automated Insights открыла бесплатный доступ к бета-версии сервиса «робота-журналиста» Wordsmith, который позволяет создавать на основе массивов данных короткие заметки, написанные естественным языком.

Вот еще интересный пример.

Скот Хорсли состязается с роботом. Источник: An NPR Reporter Raced A Machine To Write A News Story. Who Won? NPR, May 29, 2015

В мае 2015 года Скотт Хорсли (Scott Horsley), корреспондент NPR в Белом доме и бывший бизнес-журналист, бросил дерзкий вызов пишущему алгоритму Wordsmith компании Automated Insights. «Мы хотели узнать, – пишет NPR, – как наше лучшее перо покажет себя против машины». Поскольку NPR – радио, то био-журналист был достаточно тренирован для быстрого письма. По условиям соревнования, оба противника должны были дождаться публикации финансового отчета сети кафе Denny’s и – вперед. Причем у Скота было преимущество – ведь он был постоянным клиентом Denny’s. У него там даже была любимая официантка, Женевьев, которая знала наизусть его заказ: сэндвич из яичницы с беконом. Не помогло. Хотя… как судить.

Робот управился за две минуты, Скот Хорсли – за семь с небольшим. NPR публикует обе заметки и предлагает читателю своего рода тест Тьюринга – определить, какой текст сгенерирован роботом, а какой – человеком.

Журналистский «тест Тьюринга». Источник: An NPR Reporter Raced A Machine To Write A News Story. Who Won? NPR, May 29, 2015

Робот написал, конечно же, левую заметку. В ней очевидно выше плотность цифр, и она суше по стилю. Тогда как Скот, вспомнив то ли меню, то ли Женевьев, подпустил немного необязательной для финансового отчета лирики. Например, вставил фразу: «Рост продаж показывает, что потребители не прочь раскрыть свои бумажники ради блинчиков, яиц и картофельных оладий».

Формально словарь робота больше, поскольку должен включать в себя весь словарный запас языка (это свыше 1 млн слов для английского языка). Словарь образованного англоговорящего человека может достигать 100 тысяч слов. Но робот должен использовать наиболее частотные слова, что и делает его язык «суше». Кроме того, словарь этого робота ограничен еще и финансовой специализацией. Ему и «в голову» не могло прийти, что можно использовать в финансовом отчете кулинарные или спортивные названия (grand slam). Человек же, наоборот, частотностью не ограничен и волен использовать сколь угодно редкие и вычурные слова, расширяя контекст и образность. Более того, человек-писатель потому и писатель, что использует оригинальные образы. Роботу для финансового отчета это просто не нужно.

“But that could change”, это может измениться, – пишет NPR. Если хозяин решит скормить Wordsmith массивы более раскованных текстов NPR и слегка подкрутит алгоритм, то «Словесный кузнец» быстро перестроит свою лексику, точнее – расширит границы и принципы ее применения. Это все настраивается.

Кто победил в соревновании? Робот написал быстрее, деловитее. Скот Хорсли, как это ни банально, – медленнее, но человечнее. Аудитория этой заметки – финансисты. Ценна ли для них лирическая вставка про кошельки и блинчики? Покуда читатели еще люди, а не роботы, то, наверное, да, ценна.

В общем, ничья. Хотя две минуты против семи… Для радио, для новостей финансового рынка – это может оказаться критично.
Есенинское состязание жеребенка с паровозом проводилось и в академической среде. В 2012 году Кристер Клирвал (Christer Clerwall), профессор медиа и коммуникаций из университета Карлстад, Швеция, попросил 46 студентов прочитать два спортивных отчета – один написанный роботом, и один – человеком. Человеческая заметка была сокращена до размеров роботической, но и роботическая слегка поправлена редактором: заголовок, лид, первые абзацы – как это обычно делает редактор в СМИ. Студентам было поручено оценить материалы по ряду критериев: объективность, доверие, аккуратность, занудность, интересность, ясность, удовольствие читать, полезность, цельность и т.п.

Результаты показали, что одна заметка выигрывала в одних параметрах, другая – в других. Человеческий текст получил больше баллов по критериям «хорошо написано», «приятно читать». Роботический текст, тоже предсказуемо, получил больше баллов по критериям «объективность», «четкое описание», «аккуратность» и т.п. То есть снова ничья.

Но самое главное, что выявило исследование шведского профессора, – что различия между средним текстом био-журналиста и средним текстом кибер-журналиста незначительны. Это критически важный фактор для оценки будущего и уже настоящего робото-журналистики. Кибер-скептики все время говорят, что робот не может написать лучше человека. Но это неверный подход. «А может, заметке робота не обязательно быть «лучше»? Что если она будет просто достаточно хорошей?» – делится профессор Клирвал своими опасениями с Wired.

А как вам такая история.

Это землетрясение вошло в историю журналистики. 17 марта 2014 года в 6.25 утра журналист и программист The Los Angeles Times Кен Швенке (Ken Schwencke) был разбужен подземными толчками. Он подбежал к компьютеру, где в издательской системе его уже ожидала заметка, написанная его алгоритмом Quakebot. Кен пробежал заметку глазами и нажал кнопку «Опубликовать». Так LAT стала первым СМИ, написавшем о землетрясении, – через 3 минуты после толчка. Робот-журналист опередил своих био-коллег.

Первая заметка о землетрясении, написанная роботом. Источник: The First News Report on the L.A. Earthquake Was Written by a Robot. By Will Oremus. Slate, March 17, 2014

Вот эта заметка на сайте LAТ, дополненная через час после повторного толчка. Она подписана именем Швенке, но в конце указано: «this post was created by an algorithm written by the author.»

Алгоритм Quakebot, написанный Кеном Швенке, к тому времени существовал уже два года. Quakebot подключен к ленте американской службы геомониторинга. Из нее он мгновенно берет исходные данные – место, время, амплитуду, сравнивает эти данные с предыдущими землетрясениями в этом районе, тем самым автоматически определяя историческую значимость события. Данные помещаются в подходящий шаблон, и заметка готова. Робот загружает ее в издательскую систему и посылает редактору уведомление. На Пулитцера заметка явно не тянет, зато редактор уже через несколько минут после события имеет готовую публикацию. Остается добавить, что землетрясения входят в перечень горячих новостей Лос-Анджелеса. На сайте Los Angeles Times есть целый раздел Earthquakes, который пополняется роботом-юнкором.

В той же Los Angeles Times робот ведет и другую рубрику – криминальную хронику Homicide Report, причем с 2007 (!) года. Как только полицейский coroner вывешивает в свою базу (она, очевидно, публична) рапорт о чьей-то насильственной смерти, робот берет все данные, помещает их на карту, относит к категориям по расе, полу, причине смерти, участии полицейских и т.п., и публикует заметку с простенькой шаблонной формулировкой в ленту. Далее, если событие того заслуживает, журналист добирает информацию и дописывает развернутую криминальную заметку. А если нет – то нет.