Поиск людей мл: Поиск людей ВКонтакте по полной дате рождения

Содержание

В VK появился чат-бот для поиска людей и добровольцев «ЛизаАлерт» | | Infopro54

24/06/2022, 11:12

Чтобы запустить бот, нужно написать ему слово «Привет». Робот может посоветовать, что делать при пропаже человека и как себя вести в экстренных ситуациях подобного рода.

Социальная сеть «ВКонтакте» совместно с телефонным оператором «Билайн» и отрядом «ЛизаАлерт» запустили чат-бота для поиска пропавших людей, пишет Лента.ру со ссылкой на пресс-релиз соцсети.

Чат-бот появится в официальном сообществе поискового отряда во «ВКонтакте». Чтобы запустить бот, нужно написать ему слово «Привет». Робот может посоветовать, что делать при пропаже человека и как себя вести в экстренных ситуациях подобного рода.

С помощью нового бота можно будет вступить в ряды добровольцев «ЛизаАлерт» в разных регионах России, а также оперативно связаться с модератором сообщества в случае пропажи человека, уточнили в пресс-службе.

— Для нас жизненно важно постоянно развиваться, участвовать в системных партнерствах, привлекать опыт крупного бизнеса и возможности современных технологий, — заявил председатель «ЛизаАлерт» Григорий Сергеев.

Получать новости от отряда можно в соцсети «ВКонтакте» в сообщениях от сообщества «ЛизаАлерт» или по СМС, для этого нужно подписаться на рассылку на портале. Оповещения будут бесплатными для абонентов всех операторов, добавили в пресс-службе.

Фото: flickr.com — Фотобанк Moscow-Live

ЖК «Новые Матрешки»

Пл.Маркса
25 минут

Реклама. Рекламодатель: ООО СЗ «ВИРА Инвест».

ЖК «Никольский»

Речной вокзал
30 минут

Реклама. Рекламодатель: ООО СФ Проспект

Жилой дом «Ника»

Заельцовская
15 минут

Реклама. Рекламодатель: ООО СЗ «ВИРА Инвест».

ЖК «Матрешкин двор»

Студенческая
30 минут

Реклама. Рекламодатель: ООО СЗ «ВИРА Инвест».

Grando — дом-небоскреб

Березовая роща
5 минут

Реклама. Рекламодатель: ООО СЗ «ВИРА Инвест».

Они настаивают на переходе к конкурсному производству и привлечении руководства и акционеров компании к субсидиарной ответственности.

Читать статью >>

По итогам 2022 года регион потерял 27 пунктов и занял 34 место в рейтинге.

Читать статью >>

Центробанк намерен ужесточить ответственность блогеров и интернет-консультантов за инвестиционные советы.

Читать статью >>

Получение федеральных средств на укрепление берегов Новосибиского водохранилища под вопросом. Между тем вода «съедает» около двух метров земли в год.

Читать статью >>

Актуальный разговор

В том числе потому, что заставляет думать и креативить.

Все материалы

Лента новостей

26/05/2023, 18:29

26/05/2023, 17:45

26/05/2023, 17:08

26/05/2023, 17:04

вышла новая версия мобильного приложения «VK Видео»

Главная

11:47 2023-05-25 / Демид Иванов / Интернет-сервисы

Команда разработчиков VK представила бета-версию мобильного приложения «VK Видео» с новым дизайном, возможностями просмотра контента без доступа к интернету, а также более совершенной системой рекомендаций. Обновлённый сервис уже можно сказать из магазинов Google Play и RuStore для устройств на Android. В ближайшее время ожидается публикация приложение в каталоге AppStore для iOS.

Новая версия приложения «VK Видео» получила режим просмотра контента в режиме офлайн. Теперь возможен как онлайн- так и офлайн-просмотр видео из коллекции VK, от фильмов и сериалов до любительских видео, снятых пользователями. Помимо этого, появился раздел «Тренды» с самым популярным и обсуждаемым видео. База кино и фильмов сервиса была существенным образом расширена за счёт российских и зарубежных издателей.

По данным VK, на платформе становится всё больше профессиональных материалов. К выпуску бета-версии приложения компания подготовила ряд эксклюзивных релизов новых шоу и видео известных блогеров и шоуменов.

Кроме того, была улучшена работа алгоритмов подбора и рекомендаций контента под конкретного человека, с учётом его интересов и вкусов. Найти интересный контент можно будет с помощью рекомендаций, тематических плейлистов и усовершенствованного поиска по каталогу. При этом пользователям доступен обзор просмотренных, загруженных, понравившихся и добавленных в закладки видеороликов.

Помимо этого, появились различные элементы управления видео, а также возможность просмотра контента в режиме «картинка в картинке». Благодаря поддержке тайм-кодов можно быстро переходить к понравившимся моментам в видеороликах, а любимые видео можно группировать в плейлисты.

Для авторизации пользователям потребуется VK ID, что применяется в других проектах холдинга VK, причём просмотры видео при посещении «ВКонтакте» будут синхронизированы с «VK Видео».

Разработчики сообщают, что бета-тестирование предусматривает корректировку функциональности и рекомендательных алгоритмов продукта, поэтому конечная версия может отличаться от той, что предлагается сегодня. Готовый продукт должен быть представлен осенью текущего года.

9 вещей, которые мы знаем наверняка

Технологические гиганты вкладывают значительные средства в машинное обучение.

В 2019 году Microsoft инвестировала в 11 стартапов в области искусственного интеллекта (ИИ), вложив 1 миллиард долларов только в OpenAI. И они даже не являются крупнейшим источником корпоративного венчурного капитала, вливающегося в стартапы ИИ.

В том же году Intel Capital осуществила 19 инвестиций, а Google Ventures — 16 инвестиций.

Этот огромный приток капитала означает, что вычислительная мощность ИИ быстро развивается в ряде секторов, от здравоохранения и строительства до маркетинга и поисковой оптимизации.

Однако, прежде чем мы перейдем к последствиям машинного обучения для специалистов по поисковой оптимизации, давайте определим, что мы подразумеваем под ИИ.

Существует 3 типа ИИ:

Узкий или слабый ИИ: Этот тип ИИ предназначен для выполнения специализированных задач, которые должны быть «обучены» алгоритму (вспомните алгоритмы поиска Google). Хотя узкий ИИ (ANI) является чрезвычайно специализированным по масштабу, он способен быстро распознавать закономерности и выполнять задачи способом, превосходящим человеческие возможности.
Общий или сильный ИИ: Способный к автономному обучению и решению проблем, общий ИИ (AGI) выводит машинное обучение на новый уровень. Этот ИИ основан на процессах глубокого обучения, разработанных для отражения нейронных сетей человеческого мозга, что позволяет алгоритму принимать решения без инструкций.
Искусственный сверхразум: На данный момент искусственный сверхразум (ИСИ) по-прежнему полностью относится к категории научной фантастики. Теоретически этот тип ИИ был бы способен превзойти человеческие возможности в решении «неразрешимых» проблем нашего времени.

В то время как такие компании, как OpenAI и Conversion.ai, движутся к разработке общего ИИ для обработки естественного языка, в настоящее время нет четких примеров AGI.

Чтобы перейти от ANI к AGI, глубокое обучение станет ключом к созданию более сильного ИИ, способного использовать дедуктивные рассуждения для анализа сложных неструктурированных данных и принятия независимых решений.

Еще в 2016 году Google объявила о своем намерении стать компанией, «прежде всего занимающейся машинным обучением». С тех пор они неуклонно продвигались к этой цели, запустив Google AI в 2017 году и внедрив BERT в 2019 году. .

С какой целью они полностью используют машинное обучение?

Ну, согласно Google, они хотят не только облегчить нашу жизнь, но и использовать ИИ, чтобы найти «новые взгляды на существующие проблемы, от переосмысления здравоохранения до продвижения научных открытий».

Помимо этих высоких целей на будущее, человечество уже видит эти достижения машинного обучения в меньшем масштабе в том, с чем мы взаимодействуем каждый день, — алгоритмах поисковых систем.

Google добился устойчивого прогресса в том, как он связывает пользователей с контентом, который они ищут, включая эти девять способов, которые, как мы знаем, поисковые системы используют машинное обучение прямо сейчас.

1. Обнаружение шаблонов

Поисковые системы используют машинное обучение для обнаружения шаблонов, которые помогают идентифицировать спам или дублированный контент.

Контент низкого качества обычно имеет явные сходства, например:

Наличие нескольких исходящих ссылок на несвязанные страницы.
Множество вариантов использования стоп-слов или синонимов.
Частота встречаемости выявленных «спамных» ключевых слов.

Машинное обучение распознает эти шаблоны и отмечает их. Он также использует данные о взаимодействиях пользователей, чтобы обнаруживать, когда используются новые структуры и методы спама, распознавать новые шаблоны и успешно помечать их.

Несмотря на то, что Google по-прежнему использует людей для оценки качества, использование машинного обучения для обнаружения этих шаблонов резко сокращает количество рабочей силы, необходимой для просмотра контента.

Таким образом, Google может автоматически просеивать страницы, чтобы отсеять низкокачественный контент, прежде чем вмешается реальный человек.

Машинное обучение — это постоянно развивающаяся технология, поэтому чем больше страниц анализируется, тем точнее оно (по крайней мере, в теории).

2. Идентификация новых сигналов

RankBrain — это алгоритм машинного обучения, разработанный Google, который не только помогает выявлять закономерности в запросах, но и помогает поисковой системе выявлять возможные новые сигналы ранжирования.

До RankBrain алгоритм Google писался полностью вручную. Команда инженеров должна была анализировать результаты поисковых запросов, проводить тесты для улучшения качества этих результатов и внедрять изменения.

Теперь, когда над алгоритмом все еще работают инженеры-люди, RankBrain спокойно работает в фоновом режиме, выполняя тесты и оценивая, как изменения влияют на взаимодействие с пользователем.

RankBrain решает некоторые из сложных проблем, с которыми Google сталкивался при использовании традиционных алгоритмов, включая то, как обрабатывать поисковые запросы, которые никогда раньше не вводились в Google.

По словам Гэри Иллиса из Google в Reddit AMA 2019 года:

«RankBrain — это PR-сексуальный компонент ранжирования машинного обучения, который использует исторические данные поиска, чтобы предсказать, что пользователь [так в оригинале], скорее всего, нажмет на ранее невиданный запрос. ».

Поскольку поисковые системы могут обучать технологии тому, как выполнять прогнозы и данные самостоятельно, ручного труда может быть меньше, и сотрудники могут заняться другими вещами, которые не могут делать машины, например, инновациями или проектами, ориентированными на человека.

3. Это взвешено как небольшая часть

Однако, несмотря на то, что машинное обучение медленно меняет способ поиска и ранжирования веб-сайтов поисковыми системами, это не означает, что оно оказывает серьезное, существенное влияние (в настоящее время) на нашу поисковую выдачу.

В обсуждении часов работы центрального офиса для веб-мастеров в 2019 году Джон Мюллер из Google ссылается на то, как машинное обучение помогает инженерам Google лучше понимать различные проблемы, но он осторожно отмечает, что:

«… все для вас, когда вы загружаете Интернет с одной стороны, а с другой стороны выводятся результаты поиска ».

Совсем недавно, в ходе обсуждения Office Hours в мае 2021 года, он объяснил, что машинное обучение может корректировать вес различных сигналов ранжирования. Но опять же, есть настоящие люди, которые вручную проверяют и корректируют эти значения.

Конечная цель Google — использовать технологии, чтобы предоставить пользователям лучший опыт. Они не хотят автоматизировать весь процесс, если это означает, что у пользователя не будет того опыта, который он ищет.

Так что не думайте, что машинное обучение скоро возьмет на себя весь поисковый рейтинг; это всего лишь небольшая часть головоломки, которую поисковые системы реализовали, чтобы облегчить нашу жизнь.

4. Пользовательские сигналы на основе определенного запроса

Текущая политика конфиденциальности Google описывает, как поисковая система в настоящее время создает персонализированные результаты поиска на основе поведения пользователя.

Патент Google на персонализированный поиск, US20050102282A1, гласит:

«… персонализированный поиск генерирует разные результаты поиска для разных пользователей поисковой системы в зависимости от их интересов и прошлого поведения».

Мы можем ясно видеть это в действии. Часто используемый в презентациях на конференциях, доказательство этого процесса так же просто, как ввод строки запросов в Google за один присест и просмотр того, как результаты меняются в зависимости от того, что вы искали в последний раз.

Например, если я ищу [Футбольный стадион Нью-Йорка] в браузере в режиме инкогнито, я получаю ответ [Стадион MetLife].

Далее, если я ищу в том же браузере только [самолеты], Google предполагает, что, поскольку мой последний запрос был о футбольном стадионе, этот запрос также о футболе.

По мере того, как я продолжаю поиск, Google узнает, когда мой интерес начинает меняться.

При поиске [Jaguars] в том же браузере появится информация о команде NFL Jacksonville Jaguars (которая связана с моими последними двумя поисками).

Но в тот момент, когда я начинаю искать [зоопарк возле Сан-Диего] и набираю [зоопарк] в поле запроса, Google предлагает [зоопарки с ягуарами], хотя я не искал ягуаров во второй раз.

История поиска — это лишь один из компонентов процесса поиска, который машинное обучение использует для получения лучших результатов.

5. Обработка естественного языка

Для поисковой системы важно уметь распознавать, насколько один фрагмент текста похож на другой. Это касается не только используемых слов, но и их более глубокого значения.

Представления двунаправленного кодировщика от Transformers — для краткости BERT — это естественная среда обработки обучения, которую Google использует для лучшего понимания контекста поискового запроса пользователя.

Люди не всегда говорят так, как ожидает от них машина. Мы играем с языком, чтобы придумать новые обороты речи.

Мы используем одно и то же слово для описания разных вещей. Иногда мы даже намеренно выражаемся двусмысленно.

Однако по мере того, как все больше людей используют и ищут новые фразы в Интернете, машинное обучение может отображать более точную информацию по этим запросам.

Google Trends — отличный тому пример. Новая фраза или слово, которые набирают обороты (например, «светиться» или «разлить чай»), могут поначалу иметь бессмысленные результаты поиска.

BERT предназначен для максимально точного воспроизведения человеческого распознавания для декодирования этих контекстуальных нюансов путем изучения того, как пользователи взаимодействуют с контентом, и сопоставления поисковых запросов с более релевантными результатами.

По мере того, как язык развивается и трансформируется, машины способны лучше предсказывать смысл слов, которые мы произносим, и предоставлять нам более качественную информацию.

6. Поиск изображений для понимания фотографий

Каждую секунду в Instagram загружается примерно 1087 фотографий, а в Facebook — 4000. Это сотни миллионов фотографий, загружаемых только в эти две социальные сети каждый день.

Анализ и каталогизация такого количества отправленных материалов будет трудной (если не невозможной) задачей для человека, но идеально подходит для машинного обучения.

Машинное обучение анализирует образцы цвета и формы и сопоставляет их с любыми существующими данными схемы о фотографии, чтобы помочь поисковой системе понять, что на самом деле представляет собой изображение.

Таким образом Google может не только каталогизировать изображения для результатов поиска картинок Google, но и обеспечивает обратный поиск изображений, который позволяет пользователям выполнять поиск с использованием изображения вместо текстового запроса.

Затем пользователи могут найти другие экземпляры фотографии в Интернете, а также похожие фотографии с теми же объектами или цветовой палитрой и информацией о объектах на фотографии.

В свою очередь, то, как пользователь взаимодействует с этими результатами, может повлиять на его поисковую выдачу в будущем.

7. Улучшение качества рекламы и таргетинга

Так же, как и в обычных результатах поиска, Google хочет предоставить наиболее релевантную рекламу для своих отдельных пользователей. Согласно патентам Google США US20070156887 и US9773256, посвященным качеству рекламы, машинное обучение можно использовать для улучшения «слабой в остальном статистической модели».

Это означает, что на рейтинг объявления может влиять система машинного обучения.

«Сумма ставки, качество вашего объявления во время аукциона (включая ожидаемый рейтинг кликов, релевантность объявления и впечатления от целевой страницы), пороговые значения рейтинга объявления, контекст поиска человека» загружаются в систему по ключевым словам. на основе ключевых слов, чтобы определить, какие пороговые значения рассматриваются Google для каждого ключевого слова.

8. Идентификация синонимов

Когда вы видите результаты поиска, которые не включают ключевое слово в фрагмент, это, вероятно, связано с тем, что Google использует RankBrain для определения синонимов.

При поиске [сохранение леса] вы увидите различные результаты со словом «защита», поскольку в данном случае оно может использоваться взаимозаменяемо со словом «сохранение».

В некоторых случаях Google даже выделяет синонимы, что также указывает на то, что он распознает синонимы.

9. Уточнение запроса

Одной из моих любимых тем является намерение пользователя поискового запроса.

Есть много причин, чтобы запустить поисковую систему. Пользователи могут искать, чтобы купить (транзакционный), исследовать (информационный) или найти ресурсы (навигационный) для любого заданного поиска.

Более того, одно ключевое слово может быть полезно для одного или любого из этих намерений.

Анализируя шаблоны кликов и тип контента, с которым взаимодействуют пользователи (например, CTR по типу контента), поисковая система может использовать машинное обучение для определения намерений, стоящих за поиском пользователя.

Пример можно увидеть с запросом «лучшие колледжи» в поиске Google.

Результаты представляют собой обзоры и список колледжей в одной поисковой выдаче, причем университеты перечислены вверху. Это демонстрирует понимание Google возможных намерений, стоящих за поиском.

Это меняет то, как SEO-специалисты смотрят на структуру и размещение ссылок, поскольку алгоритм Google использует такие инструменты, как BERT, чтобы все лучше и лучше оценивать контекст размещения этих ссылок.

Резюме

Хотя машинное обучение не является (и, вероятно, никогда не будет) совершенным, чем больше людей взаимодействуют с ним, тем точнее и «умнее» оно становится.

Некоторых это может насторожить, создавая видения Скайнета из фильмов «Терминатор».

Тем не менее, фактическим результатом может быть улучшение работы с технологиями, которые решают сложные проблемы и позволяют людям сосредоточиться на творчестве и инновациях.

В 2018 году Pew Research провела опрос, в ходе которого 63% респондентов заявили, что они надеются на будущее человечества в том, что касается ИИ, и согласились с тем, что к 2030 году людям станет лучше с помощью искусственного интеллекта.

Один из способов улучшения качества жизни, который мы уже видим, — это поиск. Поскольку Google и другие поисковые системы революционизируют машинное обучение, нам становится легче находить нужную информацию и услуги, когда они нам нужны.

Дополнительные ресурсы по машинному обучению:

Руководство для начинающих по поисковой оптимизации в мире машинного обучения
Как работает машинное обучение в поиске: все, что вам нужно знать
Как машинное обучение меняет SEO и как адаптироваться

Авторы изображений

Все скриншоты сделаны автором, июнь 2021 г.

Категория SEO

Как определить поисковое намерение пользователя с помощью искусственного интеллекта и машинного обучения — блог Algolia

Время — наш самый ценный невозобновляемый ресурс. Если вы похожи на большинство людей, вас, вероятно, очень раздражает тратить свое время и энергию на чтение нерелевантной рекламы, которая бесполезна, а иногда и просто вводит в заблуждение.

Я помню, как мне исполнилось 25 лет, и я тут же увидел рекламу свадебных услуг. Как только мне исполнилось 30, они стали рекламой подгузников. Хотя эта упрощенная стратегия возрастного таргетинга иногда работает, она также может быть стереотипной и ограничивающей.

Все чаще упрощенный таргетинг рекламы раздражает пользователей. Вот почему люди начинают использовать блокировщики рекламы, и это верный способ для компании выбросить маркетинговые доллары в окно (браузера).

Есть лучший способ оптимизировать маркетинговый бюджет, чем швырять спагетти в стену в надежде, что что-то приживется. Мы знаем это, потому что наши клиенты используют метод, который я собираюсь описать, чтобы добиться увеличения рейтинга кликов (CTR) до 15% от рекламных кампаний.

Это правда, что развитие технологий помогло сделать таргетинг проще и, честно говоря, более жутким (мы смотрим на вас, Facebook!). Но мы точно знаем, что есть более эффективный способ заставить пользователей щелкнуть и получить то, что им нужно, и он связан с искусственным интеллектом.

Давайте рассмотрим, как поисковые запросы пользователей повышают эффективность рекламных кампаний.

SEO-специалисты и маркетологи, используемые для оптимизации кампаний и контента для различных типов устройств. Помните, когда вам приходилось использовать настольный ПК, чтобы выйти в Интернет? Да, более простые времена.

По мере того, как аналитика становилась все более мощной, а лежащие в ее основе технологии совершенствовались, критерии, используемые для сегментации и целевой аудитории, становились все более разнообразными. Затем, по мере того как все больше людей выходили в интернет, местоположение стало важным фактором для маркетинга и продаж. Затем появились социальные сети: компании начали собирать объемы конкретных данных о людях, что привело к еще более глубокому и тщательному таргетингу.

Так почему же, несмотря на все эти данные и технологии, миллионы по-прежнему пропадают зря?

Технологии не помогут, если вы действительно не заботитесь о покупателе.

Введите цель поиска пользователя. Как следует из этой фразы, поисковое намерение пользователя показывает, что кто-то хочет, когда он что-то гуглит. (Этот термин применим ко всем поисковым системам, но кого мы обманываем? Вы никоим образом не собираетесь Bing что-то в этом роде.)

Пользовательское намерение поиска стало сердцем мира оптимизации — будь то SEO или оптимизация коэффициента конверсии. (CRO) или других дисциплин, потому что он дает очень конкретную информацию, не будучи преследователем. Пользователь предоставляет намерение, и все, что нужно сделать компании, — это обратить внимание и правильно интерпретировать его.

И тут все становится сложнее. Google знает это лучше, чем кто-либо. Поэтому алгоритм поиска он меняет 500–600 раз (!) в год.

Ежегодно обрабатывая триллионы поисковых запросов, алгоритм Google научился понимать цель каждого запроса. Его частые обновления меняют внешний вид страниц результатов поисковой системы (SERP) в соответствии с намерениями искателя.

Например, когда вы ищете «Гарри Поттер», алгоритм знает, что вы можете захотеть узнать о книгах и фильмах, поэтому он объединяет два возможных намерения и делает релевантные результаты легко доступными:

Даже если ваша компания не Google, вы можете использовать намерения пользователей при поиске с помощью ИИ. Затем вы можете передать полученные знания в свою маркетинговую машину и делать это в масштабе. Вот как.

Как использование намерений пользователя при поиске помогает вашему бизнесу

Когда вы знаете, почему клиенты чего-то хотят, вы можете понять, как это доставить.

Если вы знаете, что кто-то ищет, вы можете предоставить нужную информацию в нужное время, чтобы помочь им найти то, что им нужно, а также:

Уменьшить шум
Снизьте стоимость привлечения клиентов (CAC)
Повысьте свой CTR
Увеличение удержания клиентов
Укрепите свои позиции
Силовой маховик направления
Оптимизируйте ресурсы, которые вы инвестируете в маркетинг

Так как же узнать, чего хотят потребители?

Мы приняли вызов выяснить это для клиента в сфере рекламных технологий. Они обрабатывали около 5 миллиардов поисковых запросов на 17 языках. В этом проекте мы сосредоточились на английском языке.

Старомодным способом определить цель поиска пользователя

Раскрытие потенциала роста с помощью цели поиска пользователя начинается с составления списка ключевых слов. Чем больше ключевых слов вы сможете собрать, тем лучше (подумайте о пяти-шестизначных числах). Просто убедитесь, что количество не мешает качеству.

Следующим шагом является интеллектуальный анализ данных, чтобы ключевые слова можно было классифицировать и выбрать для следующего этапа. Независимо от того, насколько сильно вы пытаетесь автоматизировать этот процесс, вам все равно придется вручную просматривать категории ключевых слов, чтобы убедиться, что они соответствуют вашим целям.

Тот же рабочий процесс применяется для определения намерения в ключевых словах, как с точки зрения триггеров, которые указывают намерение, так и типа намерения, прикрепленного к каждому ключевому слову (информационное, транзакционное, навигационное или рассмотрение; мы поговорим об этом ниже).

Когда вы проделали всю эту работу, которая может занять несколько часов, если вы никогда не экспериментировали с ней, пришло время использовать специальный инструмент для очистки данных и установления взаимосвязей между источниками данных.

Затем вы создадите информационную панель, чтобы вы могли получить эффективную информацию, которую маркетинговая команда может использовать при создании кампаний и оптимизации бюджетов.

Недостатки ручного определения намерений для списка ключевых слов очевидны:

Требует много времени и ресурсов
Сложно эффективно масштабировать
Требуется особое ноу-хау, которого может не хватать вашей маркетинговой команде
Не предоставляет информацию через API, который можно передать на стороннюю платформу для автоматизации будущей оптимизации

По этим причинам мы сосредоточились на поиске более масштабируемого решения для определения целей поиска пользователей, которое становится широко распространенным в крупных компаниях, поскольку их отделы маркетинга продолжают совершенствовать свои подходы и тактику.

Извлечение смысла с помощью моделей машинного обучения

Наша задача состояла в том, чтобы предсказать поисковое намерение пользователя на основе запросов. Поисковое намерение пользователя, естественно, определяется его активностью в поисковой системе (используемые запросы и ссылки, которые они нажимают) и активностью на целевых веб-сайтах, но у нас не было доступа к этим типам данных.

Наша цель состояла в том, чтобы извлечь из запросов как можно более полную и полезную информацию. Вопрос, на который мы стремились ответить, заключался в том, как модель машинного обучения может понять намерение, стоящее за запросом?

Для человека ответ очевиден: просто читай слова, которые передают смысл. Но в модели машинного обучения слово — это просто группа символов, не имеющих значения.

Когда романтический партнер спрашивает: «Что случилось, детка?» и получает в ответ «Ничего», большинство людей знают, что это не то, что человек имеет в виду. Однако у модели ML нет возможности узнать. Кроме того, намерение пользователя может быть неоднозначным даже для человека. «Ничего» может означать любое количество вещей.

Вот еще один пример: если кто-то ищет «iPhone 8», что он хочет сделать? Они ищут характеристики продукта или обзоры? Они хотят видеть фотографии телефона? Мы не знаем наверняка, но можем сделать предположение на основе нескольких категорий намерений.

Как люди определяют намерение и как это делает ИИ
Для этого варианта использования мы разделили намерение пользователя на три категории, а четвертую (соображение) добавили позже. Эти типы намерений соответствуют уровням маркетинговой воронки:
Информационное или Осведомленное
Относится к поиску информации по теме. Примеры:
«Население Нью-Йорка в 2013 г.»
«какой высоты Эйфелева башня»
Транзакционный
Относится к достижению цели или участию в деятельности. Примеры:
«купить DVD Мстители»
«Цена iPhone»
Навигационный
Также называется «Личное посещение». Относится к поиску близлежащего места или другим типам местной информации. Примеры:
«Китайский ресторан поблизости»
«расписание автобусов»
Возмещение
Это нечто среднее между информационным и транзакционным намерением. Примеры:
«Обзоры iPhone»
«Сравнение iPhone Samsung»

Что сложно для ИИ, так это неоднозначность запросов. По своей сути, некоторые из них имеют несколько намерений. Например, если кто-то ищет «гостиницы», намерение зависит от контекста. Это может быть либо навигационное (поиск близлежащего отеля), либо рассмотрение (бронирование онлайн). Это также может быть транзакционным, хотя этот общий поисковый запрос предполагает, что пользователь может быть не готов сделать бронирование.
Преобразование слов в числа, которые можно передать в модель машинного обучения
Модель не может понимать слова. Если бы мы попытались использовать необработанные данные, это было бы похоже на обучение собаки выполнять команды, показывая ей фотографии других собак. Полный бред. Модели работают на алгоритмах, поэтому, чтобы «говорить на их языке», мы должны преобразовывать запросы в их математические эквиваленты. Эта проблема относится к категории обработки естественного языка (NLP).
Преобразование слов в понятный формат может быть достигнуто с помощью моделей машинного обучения, таких как GloVe или FastText. Эти инструменты преобразуют каждое слово в набор чисел (вектор), одновременно сохраняя взаимосвязь между словами. Это означает, что два связанных слова (например, «купить» и «шоппинг») будут рассматриваться как более тесно связанные, чем два несвязанных слова (например, «купить» и «попугай»).
Ручное или автоматическое назначение меток — как масштабировать
Итак, у вас есть словесные представления и категории намерений. Что теперь?
Следующим шагом является аннотирование запросов с намерением для каждого из них и обучение модели с использованием этого набора данных. Следовательно, обученная модель научится предсказывать намерения пользователя для новых запросов. Это концепция похожа на концепцию моделей распознавания объектов. При наличии достаточного количества фотографий с кошками модель научится узнавать на фотографии кошку, которую раньше не видела.
Возвращаясь к аннотированию запросов, есть два варианта:
Маркировка данных вручную
Это причудливый способ сказать: «Посмотрите на запрос и напишите намерение рядом с ним».
Основным преимуществом аннотирования данных вручную является получение высококачественных результатов, поскольку работу выполняют люди. Однако это очень медленный процесс (на аннотирование 1000 запросов уходит около двух часов), поэтому вы не продвинетесь далеко на наборе данных, содержащем несколько миллионов запросов.
Однако небольшой результирующий набор данных можно использовать для проверки, т. е. вы можете сравнить его с результатами, сгенерированными моделью, и посмотреть, насколько они отличаются друг от друга.
Автоматическая маркировка данных
Процесс автоматической маркировки включает создание сценария, который использует несколько правил для присоединения категорий намерений к каждому запросу. Наивный подход выглядит следующим образом: предполагая, что слово «купить» указывает на транзакционное намерение, сценарий помечает все запросы, содержащие это слово, как транзакционные. Этот метод точен, но ограничивает количество помеченных запросов, поскольку не все транзакционные запросы будут включать это слово.
Для созданного нами более развитого подхода мы использовали представления слов (векторы), описанные заранее, и рассчитали расстояние между словами. Если запрос включал слово «шопинг», тесно связанное со словом «купить», скрипт помечал запрос как транзакционный.
Основное преимущество такого подхода в том, что он может обрабатывать большие объемы данных, хотя и имеет ограничения: он не распознает слова, содержащие опечатки или отсутствующие в словаре (например, конкретные модели смартфонов).
Обучение модели распознаванию целей поиска
Теперь у нас есть набор данных с помеченными данными. Следующим шагом был выбор типа модели, обучение модели, оценка результатов и итерация. Поскольку данные были помечены, у нас возникла проблема многоклассовой классификации. Вот результаты случайного списка запросов:
Обратите внимание, что намерение выражается как вероятность с использованием значения от 0 до 1. Например, запрос «кошки для продажи рядом со мной» выражает и транзакционные и навигационные намерения. Мы можем определить наиболее вероятное намерение, взглянув на самое высокое значение прогноза. Работа над этой проблемой машинного обучения была очень итеративной.
В программировании всегда есть несколько способов достижения цели (например, путем реализации функции), но если мы будем следовать шагам, мы гарантированно достигнем результата.
Машинное обучение отличается тем, что требует большого количества проб и ошибок. У нас нет четкого пути к решению, поэтому мы можем попробовать множество подходов и измерить результаты для каждого из них. После прохождения этого процесса мы можем сохранить лучшее решение и отбросить остальные. Игнорирование безвозвратных затрат — наше секретное оружие.

При работе с высказываниями или запросами, как в данном случае, очень естественно структурировать модель рекуррентным образом, а не обрабатывать их независимо друг от друга. Это связано с временным порядком слов. Таким образом, модель линейной рекуррентной нейронной сети (RNN-1) была первым, что мы использовали для моделирования задачи прогнозирования намерений.
Затем мы увеличили сложность модели, чтобы посмотреть, поможет ли решить проблему добавление нелинейностей (RNN-2), более сложных рекуррентных слоев или суммирование множественных рекуррентностей (RNN-3). В итоге у нас есть 3 рекуррентные модели, каждая из которых усложняется по сравнению с предыдущей.
Мы также построили сверточную нейронную сеть без рекурсии (CNN-1), где каждое слово в запросе не зависит от предыдущих, используя максимальное объединение во времени. Концептуально каждое слово фильтруется с использованием сверточного слоя; затем для каждого индекса в признаке слов мы вычисляем максимальное значение, в результате чего получается один признак по всему запросу.
Входными данными для нейронных сетей является встраивание слов (GloVe, Fasttext, One-hot), производящее вероятностный вывод для каждого из трех намерений из функции активации softmax. Затем, во время тестирования, выбранное намерение является намерением с наибольшей вероятностью (прогнозирование с одним намерением) или самими вероятностями (прогнозирование с несколькими намерениями).
Мы создали несколько версий модели, всего 8, начиная с самого простого набора слов, а затем итеративно совершенствуя каждый метод, основываясь как на результатах, так и на здравом смысле. Мы также использовали внешний инструмент аннотации (Ext-1). Ниже мы приводим составленную таблицу, в которой подчеркнуты сходства и различия между каждым из них.
В наших выводах мы заметили, что, хотя изменение архитектуры модели дает очень небольшое улучшение, использование более богатого словесного представления каждый раз улучшает результаты на несколько процентов. Глядя на GloVe-100 и GloVe-300, мы видим постоянное улучшение. Использование Fasttext или GloVe не влияет на конечный результат: оба дали конкурентоспособные результаты.
Однако, пожалуй, самым удивительным результатом было то, что с использованием непредварительно обученного встраивания (горячее включение) приводит к очень большому улучшению по сравнению со всеми другими представлениями. С использованием этого представления можно было обучить только рекуррентные модели, а сверточная модель расходится при обучении. Это может быть связано с большим количеством требуемых параметров, плохой инициализацией или отсутствием надлежащей настройки гиперпараметров.
В любом случае, как RNN-1, так и RNN-2, обученные однократному кодированию в словаре 1M, дают очень хорошие результаты: 75,61% для множественного намерения (2 соглашения) и 790,01% для одного намерения (3 соглашения).

Прежде чем создавать собственную модель поисковых намерений пользователей, имейте в виду, что метод автоматической маркировки дает наилучшие результаты, когда все поисковые запросы относятся к одной и той же категории (например, мода, розничная торговля, автомобили или стиль жизни).

Поиск людей мл: Поиск людей ВКонтакте по полной дате рождения

В VK появился чат-бот для поиска людей и добровольцев «ЛизаАлерт» | | Infopro54

ЖК «Новые Матрешки»

ЖК «Никольский»

Жилой дом «Ника»

ЖК «Матрешкин двор»

Grando — дом-небоскреб

вышла новая версия мобильного приложения «VK Видео»

Похожие сюжеты / 6

Активность

9 вещей, которые мы знаем наверняка

1. Обнаружение шаблонов

2. Идентификация новых сигналов

3. Это взвешено как небольшая часть

7. Улучшение качества рекламы и таргетинга

8. Идентификация синонимов

9. Уточнение запроса

Резюме

Как определить поисковое намерение пользователя с помощью искусственного интеллекта и машинного обучения — блог Algolia

Как использование намерений пользователя при поиске помогает вашему бизнесу

Старомодным способом определить цель поиска пользователя

Извлечение смысла с помощью моделей машинного обучения

alexxlab

Добавить комментарий Отменить ответ

Поиск людей мл: Поиск людей ВКонтакте по полной дате рождения

В VK появился чат-бот для поиска людей и добровольцев «ЛизаАлерт» | | Infopro54

ЖК «Новые Матрешки»

ЖК «Никольский»

Жилой дом «Ника»

ЖК «Матрешкин двор»

Grando — дом-небоскреб

вышла новая версия мобильного приложения «VK Видео»

Похожие сюжеты / 6

Активность

9 вещей, которые мы знаем наверняка

1. Обнаружение шаблонов

2. Идентификация новых сигналов

3. Это взвешено как небольшая часть

7. Улучшение качества рекламы и таргетинга

8. Идентификация синонимов

9. Уточнение запроса

Резюме

Как определить поисковое намерение пользователя с помощью искусственного интеллекта и машинного обучения — блог Algolia

Как использование намерений пользователя при поиске помогает вашему бизнесу

Старомодным способом определить цель поиска пользователя

Извлечение смысла с помощью моделей машинного обучения

alexxlab

Добавить комментарий Отменить ответ

Почему грудничок плачет по вечерам: основные причины и способы успокоить малыша

Кал у грудничка после банана: особенности стула и почему он может меняться

Лечение насморка у детей по методу Комаровского: эффективные способы и рекомендации