Навигация

Популярные статьи

Авторские и переводные статьи

Пресс-релизы

Регистрация на сайте


Опрос
Какие телеканалы вы смотрите чаще?







Поиск@Mail.Ru научился отличать книги от фильмов


21 декабря 2009 | Интернет / На русском языке / Россия / Пресс-релизы | Добавил: Сергей Никандров
21 декабря 2009 года, Москва. Поиск@Mail.Ru (http://go.mail.ru) продолжает работать над распознаванием возможных значений запросов пользователей с целью выдачи максимально подходящих результатов. Очередным шагом в этом направлении стал запуск нового алгоритма обработки названий фильмов и книг, для которых такая задача особенно актуальна.

Не секрет, что многие фильмы являются экранизацией книг или просто имеют одинаковые с ними названия, поэтому в такой ситуации корректное распознавание желания пользователя – задача особенно сложная и важная. Хороший пример многозначного запроса – название «Война и мир» (http://go.mail.ru/search?q=война и мир), которое принадлежит двум литературным произведениям (роману Льва Толстого и пьесе Михаила Булгакова) и пяти экранизациям.

Поисковый робот GoGo.Ru, используемый на Поиске@Mail.Ru, умеет корректно выделять фактологические данные из проиндексированной информации. В частности, он автоматически определяет все возможные объекты, которые обычно упоминаются под названием «Война и мир», и наиболее характерные для них слова – имена авторов, актеров и т.д. Также робот анализирует поведение пользователей, которые ищут информацию по тому или иному многозначному запросу, и определяет, какое именно значение чаще всего интересует людей. В случае с «Войной и миром» обычно имеется в виду роман Льва Толстого. В результате пользователь увидит над результатами поиска по такому запросу краткую справку по данному произведению.

Стоит отметить, что формат подсказки также учитывает наиболее часто встречающиеся желания пользователей. Например, в случае с книгой человек практически всегда хочет получить ее текст, поэтому любая справка по произведению, помимо имени автора и краткого описания, почти всегда (когда это возможно) содержит ссылку «Читать», которая отправляет пользователя на сайт одной из электронных библиотек. Если на сайте библиотеки робот обнаружил файл с текстом, то пользователю предлагается еще и скачать книгу. В случае с фильмами людей интересуют как трейлеры и ролики, так и сюжет, имена режиссера и актерского состава, поэтому все эти данные также агрегируются роботом.

В ряде случаев пользователю предлагается уточнить запрос наиболее подходящими словами, список которых, опять-таки, формируется на основании данных о поведении людей на поисковике. В случае с фильмом это может быть имя актера, исполнившего главную роль. Кликнув на уточняющий запрос, пользователь увидит справку по необходимой ему экранизации (например, по «Войне и миру» Сергея Бондарчука 1965 года) и результаты уточненного поиска.

В настоящее время специалисты Поиска@Mail.Ru ведут работу над расширением справочных возможностей проекта, которые позволят сделать поиск еще удобнее и эффективнее.

Еще несколько примеров:

Книга мастеров

Побег из Шоушенка

Достучаться до небес

Зеленая миля

Криминальное чтиво

Крестный отец

Мастер и Маргарита

Сто лет одиночества

О компании:

Mail.Ru – главный коммуникационный портал Рунета. Ежемесячная аудитория сайта превышает 50 миллионов человек. На его страницах пользователям доступны около 40 проектов, главные из которых – крупнейший в России и странах СНГ сервис бесплатной электронной почты, лидирующий российский инстант-мессенджер Mail.Ru Агент, национальная социальная сеть Мой Мир@Mail.Ru, фото-, видео- и блогхостинги Фото@Mail.Ru, Видео@Mail.Ru, Блоги@Mail.Ru, ведущий игровой портал Игры@Mail.Ru, поисковая система Поиск@Mail.Ru и многие другие. У портала есть 8 российских офисов - в Москве, Санкт-Петербурге, Екатеринбурге, Нижнем Новгороде, Новосибирске, Челябинске, Самаре и Казани, а также зарубежное представительство в Киеве (Украина).




Источник: Пресс-служба Mail.Ru
Комментарии (0) | Распечатать | | Добавить в закладки:  

Другие новости по теме:


 



Телепрограммы для газет и сайтов.
25-ть лет стабильной работы: телепрограммы, анонсы, сканворды, кроссворды, головоломки, гороскопы, подборки новостей и другие дополнительные материалы. Качественная работа с 1997 года. Разумная цена.

Форум

Фоторепортажи

Авторская музыка

Погода

Афиша

Кастинги и контакты ТВ шоу

On-line TV

Партнеры

Друзья

Реклама

Статистика
Главная страница  |  Регистрация  |  Добавить новость Copyright © 2002-2012 Все о ТВ и телекоммуникациях. Все права защищены.