вот тут некоторые говорят, что Google научился понимать русскую морфологию
Идем на Google (и Yandex для сравнения).
Yandex: Канада и в Канаду
Google: Канада и в Канаду
Илья, а при чём тут изба в деревне? Гугл далеко не всякий раз расширяет запрос словоформами. Но часто расширяет. Например, спроси "простой" - не расширяет, спроси "простой фон" - расширяет. "Секреты простого фона" - ещё больше расширяет.
Как я уже писал в ЕЖЕ-лист, разница с Яндексом хорошо видна на запросе "обмен банок на деньги" - у Гугла финансовые учреждения в результатах не появляются.
Я не понимаю что значит первый запрос. что тут ищут?
Но тем не менее, если ты хочешь сказать аудитории, что гагл ищет только существительное "простой", то ты ввел аудиторию в заблуждение: у гагла в десятке "простой пользователь", "простая розетка" и "простая семья". И ни разу ни "простой вагонов". Ни одного. У нас же - "простой сайт", "простой телефон" и "простой хостинг". Женский род в гагле "лезет" (доминирует в выдаче) в косвенных падежах, что по-моему неправильно. У нас по крайней мере род соблюден.
Что касается второго запроса, то это очень специальная конструкция, составленная опытным лингвистом, и призванная продемонстрировать принипиальные проблемы полисемии, но и здесь в десятке яндекса стеклянные банки и бутылки - 5 ответов из 10 (включая данный постинг). Вообще, такой запрос конечно же не задают: людям свойственно избегать полисемии даже в устной речи, не говоря уже про человеко-машинный диалог, из опасений быть не понятым. Например, есть такое слово в английском "hare" - заяц. Оно практически не используется в речи из за пересечения с "hair", которое есть волосы.
Нет, я имел в виду, что Гугл не всегда использует морфологию, только и всего.
Что касается банок, Илья, то это вполне реальный запрос. Я его до того спрашивал в другом поисковике, чтобы понять, что это за автоматы везде поставили.
И вообще-то, в нём нет никакой полисемии - какая же полисемия в словах " обмен банок на деньги"? Даже омонимии никакой нет в принципе. Все три значимых слова НЕ ИМЕЮТ ГРАММАТИЧЕСКИХ ОМОНИМОВ. Это у тебя в поисковике возникает излишняя, наведённая полисемия, а ты уже сам думаешь, как Яндекс.
Я не хочу сказать, что Гугл всё сделал сильно лучше, или что он ищет сильно лучше. Я хочу сказать, что сама идея препроцессинга запроса с целью решить для каждого слова, применять ли морфологическое расширение запроса - это хорошая идея. Заметим, что лично мне она в Рамблере в голову не пришла, я точно так же, как и Яндекс, подключил там морфологию механически, для всех слов, во всех ситуациях. А гугловцы долго вообще не подключали, а теперь подключили разборчиво, с оглядкой. Это правильно.
Там может быть много подходов - различать частые и редкие формы (не давать повелительным наклонениям всё портить), различать словосочетания в запросе и расширять только согласованными формами, учитывать статистику распределения омонимов по корпусу и редкие давить по весу, проводить предварительный запрос к индексу и оценивать перспективность омонимов (так делал Следопыт). Ну и так далее. Просто у русских поисковиков подключение морфлогии как-то остановилось на самом первом очевидном этапе. Или в Яндексе это уже не так?
Пардон, нужно уточнение: я не заметил одного грамматического омонима - у слова "банок" есть два объяснения - множественный родительный от "банка" (посудина) и множественный родительный от singularia tantum "банки" (средство от простуды).
Но это роли в данном случае никакой не играет, ибо и то и другое - это именно банка, а с банком как финансовой организаций слово "банок" нельзя перепутать ну просто никак. Потому что у него нет такой формы в парадигме.
Поэтому, когда в этот запрос про БАНКУ всё-таки лезет "банк", это не принципиальная проблема многозначности языка или специально подобранный недоброжелателем хитрый запрос, а просто элементарно неправильная работа Яндекса.
Ну, это же не очень важно, какой именно падеж-число находятся. Важно, релевантные ли документы выдаются. Ясно, что в данной ситуации любой документ про финансовые учреждения - нерелевантен (если только это не то место, куда деньги от банок поступают).
А ты по сути сейчас рассуждаешь чисто механически, как сама поисковая машина. Я помню, когда-то давно я разговаривал с Димой Крюковым про релевантность. Он мне говорил "ну, эти два слова на этой странице есть? Есть. Значит, я правильно её выдаю". Ты сейчас говоришь " эти два слова совпадают по форме "банки"? Совпадают. Значит, я правильно их выдаю". А релевантность же про другое, верно?
А Гугл в этой ситуации вообще форму "банок" не превращает в основу, ищет как есть, и поэтому про финансовые банки не находит ничего, что и правильно.
Забавно, но по слову "банок" Гугл не находит ничего о банках Я уж было подумал, что Яндекса работа, но однако по запросу "канаду" гугл и яндекс ведут себя по-разному. По запросу канада гугл включает поиск по словоформам:
а вот по запросу "канаду" уже нет!!!!
вот и думай теперь, то ли это супер-пупер интеллектуальный алгоритм, то ли бага. Яндекс, кстати, по обоим словам ищет со всеми словоформами.
Запрос "Коса" В русском языке я знаю три значения этого слова: 1. Девичья коса (более пожилые кос не носят ) 2. Коса для покоса трав 3. Песчаная коса
Гугль дал по топу 10 : 1. Обичайте себе си и своята коса (что это не понял, но наверное что-то из трех вышеперечисленных) 2. Парфюмерия и козметика/Боя за коса ( наверное то-же около дела) 3. песчаная коса 4. Гладките кокове, прибраната назад коса 5. за изтощена коса (что-то с косметикой) 6. Бленд за контрол на увредена коса (косметика)
в результате пункт второй выпал
Yandex по топу 10 : 1.Расти, коса, за три часа или Секреты наращивания волос 2.Антон Чехов. Зеленая коса 3. и .всёёёё .. больше нету
все остальное как и в гугле мусор, типа названия фирм и бутиков
Теле2 выражает свою признательность и благодарность компании iConText за сотрудничество и профессиональную работу.
За время сотрудничества iConText зарекомендовала себя как ответственного и надежного подрядчика. Профессионализм коллектива, принимаемые решения в области интернет-маркетинга, позволяют называть iConText надежным партнером. Отдельно хочется обозначить отзывчивость, высокий уровень лояльности и обслуживания для клиента. Команда Теле2 рада возможности развивать бизнес совместно с агентством iConText!
Колесняк С.В., Директор по развитию цифрового канала
Компания Полис Групп (общество с ограниченной ответственностью "Полис Групп") сотрудничает с агентством performance маркетинга iConText продолжительное время. iConText ведет для нас контекстную рекламу на Яндексе и Google.
Команда агентства сразу зарекомендовала себя как профессионалы своего делаю мы довольны сотрудничеством с iConText, это доказало время взаимодействия. Поэтому смело можем рекомендовать компанию как ответственного партнера, команду, которая решает задачи продвижения бренда компании оперативно, эффективно и с оптимальным бюджетом.
iaudio x5 прошивка
- Google уже научился понимать русскую орфографию?
- Нет, он купил Яндекс.XML
Гугл далеко не всякий раз расширяет запрос словоформами. Но часто расширяет.
Например, спроси "простой" - не расширяет, спроси "простой фон" - расширяет.
"Секреты простого фона" - ещё больше расширяет.
Как я уже писал в ЕЖЕ-лист, разница с Яндексом хорошо видна на запросе "обмен банок на деньги" - у Гугла финансовые учреждения в результатах не появляются.
Но тем не менее, если ты хочешь сказать аудитории, что гагл ищет только существительное "простой", то ты ввел аудиторию в заблуждение: у гагла в десятке "простой пользователь", "простая розетка" и "простая семья". И ни разу ни "простой вагонов". Ни одного. У нас же - "простой сайт", "простой телефон" и "простой хостинг". Женский род в гагле "лезет" (доминирует в выдаче) в косвенных падежах, что по-моему неправильно. У нас по крайней мере род соблюден.
Что касается второго запроса, то это очень специальная конструкция, составленная опытным лингвистом, и призванная продемонстрировать принипиальные проблемы полисемии, но и здесь в десятке яндекса стеклянные банки и бутылки - 5 ответов из 10 (включая данный постинг). Вообще, такой запрос конечно же не задают: людям свойственно избегать полисемии даже в устной речи, не говоря уже про человеко-машинный диалог, из опасений быть не понятым. Например, есть такое слово в английском "hare" - заяц. Оно практически не используется в речи из за пересечения с "hair", которое есть волосы.
Что касается банок, Илья, то это вполне реальный запрос. Я его до того спрашивал в другом поисковике, чтобы понять, что это за автоматы везде поставили.
И вообще-то, в нём нет никакой полисемии - какая же полисемия в словах " обмен банок на деньги"? Даже омонимии никакой нет в принципе. Все три значимых слова НЕ ИМЕЮТ ГРАММАТИЧЕСКИХ ОМОНИМОВ.
Это у тебя в поисковике возникает излишняя, наведённая полисемия, а ты уже сам думаешь, как Яндекс.
Я не хочу сказать, что Гугл всё сделал сильно лучше, или что он ищет сильно лучше. Я хочу сказать, что сама идея препроцессинга запроса с целью решить для каждого слова, применять ли морфологическое расширение запроса - это хорошая идея. Заметим, что лично мне она в Рамблере в голову не пришла, я точно так же, как и Яндекс, подключил там морфологию механически, для всех слов, во всех ситуациях.
А гугловцы долго вообще не подключали, а теперь подключили разборчиво, с оглядкой. Это правильно.
Там может быть много подходов - различать частые и редкие формы (не давать повелительным наклонениям всё портить), различать словосочетания в запросе и расширять только согласованными формами, учитывать статистику распределения омонимов по корпусу и редкие давить по весу, проводить предварительный запрос к индексу и оценивать перспективность омонимов (так делал Следопыт). Ну и так далее.
Просто у русских поисковиков подключение морфлогии как-то остановилось на самом первом очевидном этапе.
Или в Яндексе это уже не так?
Но это роли в данном случае никакой не играет, ибо и то и другое - это именно банка, а с банком как финансовой организаций слово "банок" нельзя перепутать ну просто никак.
Потому что у него нет такой формы в парадигме.
Поэтому, когда в этот запрос про БАНКУ всё-таки лезет "банк", это не принципиальная проблема многозначности языка или специально подобранный недоброжелателем хитрый запрос, а просто элементарно неправильная работа Яндекса.
Сравни [духи] и [дух], [ноты] и [нота], [имена] и [имя]
Для многословных запросов тоже есть правила приоритезации, например при работе с фамилиями.
Находятся именно [банка] и [банки], то есть родительный падеж или множественное число от [банка].
Важно, релевантные ли документы выдаются.
Ясно, что в данной ситуации любой документ про финансовые учреждения - нерелевантен (если только это не то место, куда деньги от банок поступают).
А ты по сути сейчас рассуждаешь чисто механически, как сама поисковая машина. Я помню, когда-то давно я разговаривал с Димой Крюковым про релевантность. Он мне говорил "ну, эти два слова на этой странице есть? Есть. Значит, я правильно её выдаю". Ты сейчас говоришь " эти два слова совпадают по форме "банки"? Совпадают. Значит, я правильно их выдаю".
А релевантность же про другое, верно?
А Гугл в этой ситуации вообще форму "банок" не превращает в основу, ищет как есть, и поэтому про финансовые банки не находит ничего, что и правильно.
а вот по запросу "канаду" уже нет!!!!
вот и думай теперь, то ли это супер-пупер интеллектуальный алгоритм, то ли бага. Яндекс, кстати, по обоим словам ищет со всеми словоформами.
В русском языке я знаю три значения этого слова:
1. Девичья коса (более пожилые кос не носят
2. Коса для покоса трав
3. Песчаная коса
Гугль дал по топу 10 :
1. Обичайте себе си и своята коса (что это не понял, но наверное что-то из трех вышеперечисленных)
2. Парфюмерия и козметика/Боя за коса ( наверное то-же около дела)
3. песчаная коса
4. Гладките кокове, прибраната назад коса
5. за изтощена коса (что-то с косметикой)
6. Бленд за контрол на увредена коса (косметика)
в результате пункт второй выпал
Yandex по топу 10 :
1.Расти, коса, за три часа или Секреты наращивания волос
2.Антон Чехов. Зеленая коса
3. и .всёёёё .. больше нету
все остальное как и в гугле мусор, типа названия фирм и бутиков