Перейти до вмісту
Пошук в
  • Детальніше...
Шукати результати, які ...
Шукати результати в ...

[Поддержка] Поисковая система с морфологией и релевантностью PRO


sv2109

Recommended Posts

8 минут назад, chukcha сказал:

Стесняюсь спросить - вы подразумеваете morphy?

Да, почему псевдокорень, а не базовая форма?

Надіслати
Поділитися на інших сайтах

36 минут назад, Vladzimir сказал:

Два вопроса. Почему именно saundex и псевдокорень?

это совсем разные вещи они используются для разных задач и не могут заменять друг друга. Модуль использует и одно и другое для разных задач, одно для неточного поиска, другое для точного. 

Надіслати
Поділитися на інших сайтах

10 минут назад, Vladzimir сказал:

Да, почему псевдокорень, а не базовая форма?

уже точно не помню, я экспериментировал с этим и остановился на псевдокорне, видно были причины именно этого выбора. 

Надіслати
Поділитися на інших сайтах

8 минут назад, sv2109 сказал:

уже точно не помню, я экспериментировал с этим и остановился на псевдокорне, видно были причины именно этого выбора. 

saundex дает всего 7000 вариантов. И для руссого языка он совершенно не пригоден.

Есть же metaphon. И даже есть реализация данного алгоритма для русского языка.

Псевдокорень удобен при full-scan базы.

А базовая форма дает более точные результаты.

Надіслати
Поділитися на інших сайтах

1 минуту назад, Vladzimir сказал:

saundex

soundex (не важно , но бросается в газа)

 

 

4 минуты назад, Vladzimir сказал:

metaphon

metaphonе (не важно , но бросается в газа)

 

 

11 минут назад, sv2109 сказал:

я экспериментировал с этим

Возможно эксперименты ...

 

Надіслати
Поділитися на інших сайтах

3 часа назад, Vladzimir сказал:

saundex дает всего 7000 вариантов. И для руссого языка он совершенно не пригоден.

Есть же metaphon. И даже есть реализация данного алгоритма для русского языка.

я его тоже тестировал, просто это используется для неточного поиска, и соундекс дает да, меньше вариантов но и шансов найти что-то при неправильном написании, ошибках, опечатках итд, в тоже время метафон он более точный это с одной стороны хорошо, а с другой даст меньше вариантов при поиске. 
тут идеального варианта не существует у каждого есть свои плюсы и минусы. 
в будущих версиях может просто вынесу это в настройки модуля чтобы был выбор какой инструмент использовать. 

Надіслати
Поділитися на інших сайтах

16 минут назад, sv2109 сказал:

просто вынесу это в настройки модуля чтобы был выбор какой инструмент использовать. 

Чтобы снести мозг пользователям :)

Надіслати
Поділитися на інших сайтах

9 минут назад, chukcha сказал:

Чтобы снести мозг пользователям :)

:) ну это всегда так получается: или пишешь модуль где минимум настроем и получаешь кучу упреков "а почему нельзя сделать вот так или вот так, а так хочется.." или делаешь больше настроек и получаешь упреки что все слишком сложно и ничего не понятно)) 

Надіслати
Поділитися на інших сайтах

35 минут назад, Vladzimir сказал:

Просто оставлю это здесь

https://github.com/seo-sea-sem/php/blob/master/semantics/similar.php

все хорошо, но тут речь идет о двух языках
ru и en
а ведь есть масса других  (не обязательно кириллических)
Спасибо за ссылку..

Я понимаю, что тема не для поддержки модуля..


$query = "SELECT ru_words, translit FROM word_list";
например, а если там 100000 слов
Конечно же нет
Но на 1500 товарах
частотный словарь 
8997 слов

Надіслати
Поділитися на інших сайтах

23 минуты назад, chukcha сказал:

все хорошо, но тут речь идет о двух языках
ru и en
а ведь есть масса других  (не обязательно кириллических)
Спасибо за ссылку..

Я понимаю, что тема не для поддержки модуля..


$query = "SELECT ru_words, translit FROM word_list";
например, а если там 100000 слов
Конечно же нет
Но на 1500 товарах
частотный словарь 
8997 слов

А при чем здесь частотный словарь? Получаете фонетический хеш слова и делаете по нему поиск. Все, вы нашли похожие на ваше слово слова.

Надіслати
Поділитися на інших сайтах

Вы собираетесь на лету получать фонетику? - ну-ну

Частотный словарь, грубо, слова, которые присутствуют в текстовых полях, т.е. заранее проиндексированный контент

 

Надіслати
Поділитися на інших сайтах

В принципе частотный словарь не велик
и не пропорционально зависим от количества  товаров

Я строил на смешенной базе - фармацевтика и .. велосипеды
У фармацевтов -  название товара  - уникально
На велах - пыль

причем даже пр и таком варианте  - скорость поиска практически одинакова.

поиск в словаре пословно
Выборка из проиндексированой таблице,
+ алгоритм релевантности



 

Надіслати
Поділитися на інших сайтах

1 час назад, chukcha сказал:

Вы собираетесь на лету получать фонетику? - ну-ну

Частотный словарь, грубо, слова, которые присутствуют в текстовых полях, т.е. заранее проиндексированный контент

 

Если честно. Не совсем понятны ваши слова. В чем проблема на лету получить хеш слова и уже делать поиск по индексу?

Надіслати
Поділитися на інших сайтах

Давайте остановимся..
 

4 минуты назад, Vladzimir сказал:

уже делать поиск по индексу

так Где взять индекс?
 

Надіслати
Поділитися на інших сайтах

14 часов назад, chukcha сказал:

Давайте остановимся..
 

так Где взять индекс?
 

Сделать индекс при индексировании.

Надіслати
Поділитися на інших сайтах

В 02.10.2020 в 19:58, Vladzimir сказал:

Просто оставлю это здесь

https://github.com/seo-sea-sem/php/blob/master/semantics/similar.php

спасибо, что-то интересное на первый взгляд, но нужно тестировать. 

Надіслати
Поділитися на інших сайтах

16 часов назад, sv2109 сказал:

спасибо, что-то интересное на первый взгляд, но нужно тестировать. 

Это реализация алгоритма Daitch-Mokotoff Soundex

Надіслати
Поділитися на інших сайтах

Есть вопрос к функции

function se_clean ($text) {
...
  $text = preg_replace("/[^ a-zA-Zа-яА-Я0-9_]+/u", "", $text);
...

Украинских букв в тексте не будет по умолчанию.

 

Реализация тоже вызывает вопросы

function se_strpos_array($haystack, $needles) {
  if (is_array($needles)) {
    foreach ($needles as $str) {

Ведь можно сделать

str_replace($needles, "", $haystack, $count);
return $count;

Далее претензия на индексы в БД

 language_word language_id word
 language_sound language_id sound

Первым всегда должен идти столбец в котором больше всего уникальных значений

Надіслати
Поділитися на інших сайтах

Добрый день. Скажите пожалуйста решит ли модуль такую проблему http://joxi.ru/J2bZvGoHG3e0n2 . В шаблоне есть "живой поиск", но в некотрых моментах плохо отрабатывает. Например при поиске по артикулам. Хотелось бы чтоб он даже по части артикула (или названия) уже находил товар. Спасибо

Надіслати
Поділитися на інших сайтах


41 минуту назад, LinaVM сказал:

Добрый день. Скажите пожалуйста решит ли модуль такую проблему http://joxi.ru/J2bZvGoHG3e0n2 . В шаблоне есть "живой поиск", но в некотрых моментах плохо отрабатывает. Например при поиске по артикулам. Хотелось бы чтоб он даже по части артикула (или названия) уже находил товар. Спасибо

Да, решит, только именно этот модуль работает только на странице поиска они ничего не знает о живом поиске в вашей теме, следовательно есть варианта
1. смотреть код темы, как там устроен живой поиск и изменять его чтобы он работал вместе с модулем Поисковая система
2. взять дополнительно мой модуль живого поиска - Поиск с автодополнением, который уже работает вместе с модулем Поисковая система + обычно намного более функциональный, чем модули живого поиска с тема, напр. кроме товаров он также ищет категории, производители, информационный страницы а также имеет множество настроек. Поэтому часто проще и дешевле взять готовый модуль. чем переделывать модуль темы. 

 

Надіслати
Поділитися на інших сайтах

  • 3 weeks later...

Я запутался куда писать, но есть поиск в шапке+поисковая система.
Вопрос - если на сайте 2 языка, то как заставить поиск искать на том языке, на котором сейчас пользователь?
Поскольку сейчас ищет только на русском и даже если воткнут укр, то при поиске форсировано переключает на русский.

Надіслати
Поділитися на інших сайтах

Поисковая система с морфологией и релевантностью v3.1 [sv2109.com]
 
не создаются индексы, выполненно 0,00% застыло и не двигается
скажите что можно сделать
Надіслати
Поділитися на інших сайтах


3 часа назад, splka сказал:

Я запутался куда писать, но есть поиск в шапке+поисковая система.
 

Пишите в ЛС
Модуль поддерживает несколько языков, все должно работать, никакого переключения быть не должно. 
 

2 часа назад, pavel747 сказал:
не создаются индексы, выполненно 0,00% застыло и не двигается
скажите что можно сделать

Пишите в ЛС

Надіслати
Поділитися на інших сайтах

  • 2 weeks later...

Есть ли тестовый вариант модуля? Допустим есть необходимость установить и настроить на версии сайта для тестов, показать как будет работать. Если всё нормально купить лицензию.

Надіслати
Поділитися на інших сайтах


Створіть аккаунт або увійдіть для коментування

Ви повинні бути користувачем, щоб залишити коментар

Створити обліковий запис

Зареєструйтеся для отримання облікового запису. Це просто!

Зареєструвати аккаунт

Вхід

Уже зареєстровані? Увійдіть тут.

Вхід зараз
×
×
  • Створити...

Important Information

На нашому сайті використовуються файли cookie і відбувається обробка деяких персональних даних користувачів, щоб поліпшити користувальницький інтерфейс. Щоб дізнатися для чого і які персональні дані ми обробляємо перейдіть за посиланням . Якщо Ви натиснете «Я даю згоду», це означає, що Ви розумієте і приймаєте всі умови, зазначені в цьому Повідомленні про конфіденційність.