Другое

Алгоритм напишет Вашу биографию на основе записей в Twitter

TWITTER-CONVERSATION-1

При помощи специального приложение ваши записи в социальной сети Twitter, где пользователи делятся деталями своей жизни и своими мыслями, превратятся в вашу точную биографию: специалисты в области программирования из Университета Карнеги–Меллон в Питтсбурге и Корнелльского университета в Итаке, США, разработали алгоритм, который сам сортирует твиты и только на их основании, не прибегая к дополнительным источникам информации, создает хронологию жизни пользователя. Статья исследователей доступна на arXive .

Ключевой принцип, который лежит в основе алгоритма – это классификация записей по четырем категориям. К первой, самой важной, относятся наиболее значительные события, имеющие привязку к определенной дате – например, сообщение о начале работы на новом месте. Ко второй категории относятся твиты, которые рассказывают о действиях пользователя, являющихся стандартной частью его режима, например, о пробежках или тренировках.

В отличие от первых двух категорий, аккумулирующих события из личной жизни пользователя, к двум другим, которые также отличаются друг от друга по критерию протяженности или привязки к определенной дате, относятся твиты, не касающиеся того, что происходит непосредственно с автором: например, когда он пишет про выборы в США или о том, что на улице светит солнце.

Главной проблемой для Хувей Ли и Клэр Карди, авторов алгоритма, стало конструирование его таким образом, чтобы он мог максимально успешно отделять «зерна от плевел», то есть выделять твиты первой категории из всей массы записей. Решить эту проблему им помогло открытие, что твиты каждой категории имеют свои паттерны написания, распространения и ответов на них. Например, реакция на пост о том, что пользователь заступает на новую должность, отличается от реакции на твит о погоде или выборах президента США, поэтому разгадка лежит в правильной идентификации этих опознавательных признаков.

Для того, чтобы проверить эффективность своих разработок, Ли и Карди в течение 21 месяца следили за Twitter–аккаунтами 20 обычных пользователей и 20 знаменитостей, а затем попросили пользователей из первой группы написать автобиографию, ориентируясь на события, которые они освещали в сервисе микроблогов. Биографию знаменитостей ученые сверяли по различным источникам, например, используя Википедию. По итогам этой работы они сравнили эти «золотые стандарты» жизнеописаний с теми, которые составил их алгоритм – и он показал неплохие результаты, собрав практически все ключевые события из жизни респондентов.

Конечно, по признанию авторов, алгоритм пока не совершенен. Например, он работает только с аккаунтами тех пользователей, которые пишут более–менее регулярно и получают достаточный отклик на свои записи – тогда алгоритм может уловить характерные паттерны. Пока авторы не собираются продавать кому–либо свое детище, прекрасно понимая, какие перспективы оно открывает для множества сторон: например, в подобной разработке как минимум могут быть заинтересованы правительственные структуры и бизнес–структуры, потенциальные работодатели, медиа и органы внутренней безопасности.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Источник: yorick.kz

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: