Jump to content
Search In
  • More options...
Find results that contain...
Find results in...

[Поддержка] Поисковая система с морфологией и релевантностью PRO


sv2109
 Share

Recommended Posts

36 минут назад, Vladzimir сказал:

Два вопроса. Почему именно saundex и псевдокорень?

это совсем разные вещи они используются для разных задач и не могут заменять друг друга. Модуль использует и одно и другое для разных задач, одно для неточного поиска, другое для точного. 

Link to comment
Share on other sites

10 минут назад, Vladzimir сказал:

Да, почему псевдокорень, а не базовая форма?

уже точно не помню, я экспериментировал с этим и остановился на псевдокорне, видно были причины именно этого выбора. 

Link to comment
Share on other sites

8 минут назад, sv2109 сказал:

уже точно не помню, я экспериментировал с этим и остановился на псевдокорне, видно были причины именно этого выбора. 

saundex дает всего 7000 вариантов. И для руссого языка он совершенно не пригоден.

Есть же metaphon. И даже есть реализация данного алгоритма для русского языка.

Псевдокорень удобен при full-scan базы.

А базовая форма дает более точные результаты.

Link to comment
Share on other sites

1 минуту назад, Vladzimir сказал:

saundex

soundex (не важно , но бросается в газа)

 

 

4 минуты назад, Vladzimir сказал:

metaphon

metaphonе (не важно , но бросается в газа)

 

 

11 минут назад, sv2109 сказал:

я экспериментировал с этим

Возможно эксперименты ...

 

Link to comment
Share on other sites

3 часа назад, Vladzimir сказал:

saundex дает всего 7000 вариантов. И для руссого языка он совершенно не пригоден.

Есть же metaphon. И даже есть реализация данного алгоритма для русского языка.

я его тоже тестировал, просто это используется для неточного поиска, и соундекс дает да, меньше вариантов но и шансов найти что-то при неправильном написании, ошибках, опечатках итд, в тоже время метафон он более точный это с одной стороны хорошо, а с другой даст меньше вариантов при поиске. 
тут идеального варианта не существует у каждого есть свои плюсы и минусы. 
в будущих версиях может просто вынесу это в настройки модуля чтобы был выбор какой инструмент использовать. 

Link to comment
Share on other sites

16 минут назад, sv2109 сказал:

просто вынесу это в настройки модуля чтобы был выбор какой инструмент использовать. 

Чтобы снести мозг пользователям :)

Link to comment
Share on other sites

9 минут назад, chukcha сказал:

Чтобы снести мозг пользователям :)

:) ну это всегда так получается: или пишешь модуль где минимум настроем и получаешь кучу упреков "а почему нельзя сделать вот так или вот так, а так хочется.." или делаешь больше настроек и получаешь упреки что все слишком сложно и ничего не понятно)) 

Link to comment
Share on other sites

35 минут назад, Vladzimir сказал:

Просто оставлю это здесь

https://github.com/seo-sea-sem/php/blob/master/semantics/similar.php

все хорошо, но тут речь идет о двух языках
ru и en
а ведь есть масса других  (не обязательно кириллических)
Спасибо за ссылку..

Я понимаю, что тема не для поддержки модуля..


$query = "SELECT ru_words, translit FROM word_list";
например, а если там 100000 слов
Конечно же нет
Но на 1500 товарах
частотный словарь 
8997 слов

Link to comment
Share on other sites

23 минуты назад, chukcha сказал:

все хорошо, но тут речь идет о двух языках
ru и en
а ведь есть масса других  (не обязательно кириллических)
Спасибо за ссылку..

Я понимаю, что тема не для поддержки модуля..


$query = "SELECT ru_words, translit FROM word_list";
например, а если там 100000 слов
Конечно же нет
Но на 1500 товарах
частотный словарь 
8997 слов

А при чем здесь частотный словарь? Получаете фонетический хеш слова и делаете по нему поиск. Все, вы нашли похожие на ваше слово слова.

Link to comment
Share on other sites

Вы собираетесь на лету получать фонетику? - ну-ну

Частотный словарь, грубо, слова, которые присутствуют в текстовых полях, т.е. заранее проиндексированный контент

 

Link to comment
Share on other sites

В принципе частотный словарь не велик
и не пропорционально зависим от количества  товаров

Я строил на смешенной базе - фармацевтика и .. велосипеды
У фармацевтов -  название товара  - уникально
На велах - пыль

причем даже пр и таком варианте  - скорость поиска практически одинакова.

поиск в словаре пословно
Выборка из проиндексированой таблице,
+ алгоритм релевантности



 

Link to comment
Share on other sites

1 час назад, chukcha сказал:

Вы собираетесь на лету получать фонетику? - ну-ну

Частотный словарь, грубо, слова, которые присутствуют в текстовых полях, т.е. заранее проиндексированный контент

 

Если честно. Не совсем понятны ваши слова. В чем проблема на лету получить хеш слова и уже делать поиск по индексу?

Link to comment
Share on other sites

В 02.10.2020 в 19:58, Vladzimir сказал:

Просто оставлю это здесь

https://github.com/seo-sea-sem/php/blob/master/semantics/similar.php

спасибо, что-то интересное на первый взгляд, но нужно тестировать. 

Link to comment
Share on other sites

Есть вопрос к функции

function se_clean ($text) {
...
  $text = preg_replace("/[^ a-zA-Zа-яА-Я0-9_]+/u", "", $text);
...

Украинских букв в тексте не будет по умолчанию.

 

Реализация тоже вызывает вопросы

function se_strpos_array($haystack, $needles) {
  if (is_array($needles)) {
    foreach ($needles as $str) {

Ведь можно сделать

str_replace($needles, "", $haystack, $count);
return $count;

Далее претензия на индексы в БД

 language_word language_id word
 language_sound language_id sound

Первым всегда должен идти столбец в котором больше всего уникальных значений

Link to comment
Share on other sites

Добрый день. Скажите пожалуйста решит ли модуль такую проблему http://joxi.ru/J2bZvGoHG3e0n2 . В шаблоне есть "живой поиск", но в некотрых моментах плохо отрабатывает. Например при поиске по артикулам. Хотелось бы чтоб он даже по части артикула (или названия) уже находил товар. Спасибо

Link to comment
Share on other sites


41 минуту назад, LinaVM сказал:

Добрый день. Скажите пожалуйста решит ли модуль такую проблему http://joxi.ru/J2bZvGoHG3e0n2 . В шаблоне есть "живой поиск", но в некотрых моментах плохо отрабатывает. Например при поиске по артикулам. Хотелось бы чтоб он даже по части артикула (или названия) уже находил товар. Спасибо

Да, решит, только именно этот модуль работает только на странице поиска они ничего не знает о живом поиске в вашей теме, следовательно есть варианта
1. смотреть код темы, как там устроен живой поиск и изменять его чтобы он работал вместе с модулем Поисковая система
2. взять дополнительно мой модуль живого поиска - Поиск с автодополнением, который уже работает вместе с модулем Поисковая система + обычно намного более функциональный, чем модули живого поиска с тема, напр. кроме товаров он также ищет категории, производители, информационный страницы а также имеет множество настроек. Поэтому часто проще и дешевле взять готовый модуль. чем переделывать модуль темы. 

 

Link to comment
Share on other sites

  • 3 weeks later...

Я запутался куда писать, но есть поиск в шапке+поисковая система.
Вопрос - если на сайте 2 языка, то как заставить поиск искать на том языке, на котором сейчас пользователь?
Поскольку сейчас ищет только на русском и даже если воткнут укр, то при поиске форсировано переключает на русский.

Link to comment
Share on other sites

Поисковая система с морфологией и релевантностью v3.1 [sv2109.com]
 
не создаются индексы, выполненно 0,00% застыло и не двигается
скажите что можно сделать
Link to comment
Share on other sites


3 часа назад, splka сказал:

Я запутался куда писать, но есть поиск в шапке+поисковая система.
 

Пишите в ЛС
Модуль поддерживает несколько языков, все должно работать, никакого переключения быть не должно. 
 

2 часа назад, pavel747 сказал:
не создаются индексы, выполненно 0,00% застыло и не двигается
скажите что можно сделать

Пишите в ЛС

Link to comment
Share on other sites

  • 2 weeks later...

Есть ли тестовый вариант модуля? Допустим есть необходимость установить и настроить на версии сайта для тестов, показать как будет работать. Если всё нормально купить лицензию.

Link to comment
Share on other sites


Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
 Share

×
×
  • Create New...

Important Information

On our site, cookies are used and personal data is processed to improve the user interface. To find out what and what personal data we are processing, please go to the link. If you click "I agree," it means that you understand and accept all the conditions specified in this Privacy Notice.