levenshtein-distance

Расстояние Левенштейна: как лучше обрабатывать слова, меняющие позиции?

Я добился некоторого успеха в сравнении строк с помощью функции PHP Левенштейна. Однако для двух строк, содержащих по ... , но очень плохо, если вы поменяете порядок слов, которые кажутся обычными в школе: "колледж ххх" против "колледжа ххх".

Лучший способ в php найти наиболее похожие строки?

Ад, PHP имеет множество строковых функций, таких как levenshtein, similar_text и soundex, которые могут сравнивать с ... ва. http://www.php.net/manual/en/function .levenshtein.php Что лучше всего подходит для точности и производительности?

Сравните 5000 строк с PHP Levenshtein

У меня есть 5000, иногда больше, строк уличных адресов в массиве. Я хотел бы сравнить их всех с Левенштейном, чтобы най ... состоит в том, чтобы найти похожие записи (и устранить дубликаты) на основе предоставленных пользователем адресов улиц.

Поиск Левенштейна

Я работаю на сайте, который продает, скажем, вещи и предлагает "поиск поставщиков". В этом поиске вы вводите свой гор ... ь медленная. Итак, мой вопрос: "Есть ли какой-нибудь способ ускорить этот поиск даже в очень больших наборах данных?"

Как вы проверяете, похожи ли два хэша (пароля)?

Когда пользователь создает пароль, я хэширую его (включая соль) и сохраняю в БД. Теперь, когда пользователь хочет сме ... или ссылки на статьи, в которых это обсуждается более подробно, я был бы признателен, если бы они могли поделиться ими.

Левенштейн: MySQL + PHP

$word = strtolower($_GET['term']); $lev = 0; $q = mysql_query("SELECT `term` FROM `words`"); while($r = mysql_fetch_ ... ]; } } Как я могу перенести все это в один запрос? Не хочу запрашивать все термины и выполнять фильтрацию на PHP.

Ускорение левенштейна /аналогичный текст на PHP

В настоящее время я использую similar_text для сравнения строки со списком ~50 000, который работает, хотя из-за количе ... ю кто-то опубликовал в руководстве, выглядит интересной. Я упускаю что-то, что могло бы сделать это значительно быстрее?

Расставляйте точки там, где слово написано с ошибкой

Я создаю веб-приложение на PHP, в котором люди могут попытаться перевести слова, которые им нужно выучить для школы. ... ций необходимо выполнить. Итак, как я могу вернуть слово с ошибкой с точками в тех местах, где кто-то допустил ошибку?

Самая длинная общая подстрока с неправильным допуском символов

У меня есть скрипт, который я нашел здесь, который хорошо работает при поиске самой низкой общей подстроки. Однако мн ... нкция PHP Левенштейна ограничена 255 символами, а некоторые из стогов сена, которые я ищу, содержат более 1000 символов.

Как я могу создать порог для похожих строк, используя расстояние Левенштейна, и учесть опечатки?

Недавно мы столкнулись с интересной проблемой на работе, когда обнаружили дубликаты данных, отправленных пользователем, ... пособ учесть опечатки при создании такого рода порога для соответствия данных? Дайте мне знать, если я смогу уточнить!

Объединение левенштейна с массивом in в PHP?

Я хочу проверить, присутствует ли в массиве левенштейн с коэффициентом

PHP: использование расстояния Левенштейна для сопоставления слов

Я читал и тестировал некоторые примеры в phpлевенштейн. Сравнение $ввода с $словами выводит сравнение $input = 'hw r u ... nce $closest = $word; $shortest = $lev; } } return $closest; } ?>

Определите, близки ли два имени друг к другу

Я создаю систему для своей школы, где мы можем проверить, внесен ли ученик в черный список, на вечеринках и других меро ... это сделать? может быть, с MySQL? или модифицированная версия расстояния Левенштейна? Возможно ли регулярное выражение?

Получите наиболее повторяющиеся похожие поля в базе данных MySQL

Давайте предположим, что у нас есть база данных, например: Actions_tbl: Действия ----------------------------------- ... пасибо за ваши интеллектуальные ответы, я был бы очень признателен, если бы вы могли пролить некоторый свет на ситуации

PHP - Сравните многомерные подмассивы друг с другом и объедините по порогу сходства

Введение - Этот вопрос был обновлен 27 мая 2018 года: У меня есть 1 PHP многомерный массив, содержащий 6 суб-массиво ... raaaw", "kitty", "growup", "Fun", "claws", "fish", "salmon", "ball", "cat", "kitten", "sleep", "fish", "purr") ) );

Сравнение стилей "Викторины личности" [PHP] [закрыто]

Я пытаюсь придумать эффективный или разумный алгоритм, чтобы взять результаты теста, представленного пользователем, и с ... D"), с ответами каждого кандидата и измерить сходство таким образом? Есть какие-нибудь предложения? Большое спасибо.

PHP Проценты Левенштейна

Можете ли вы объяснить, почему мне нужно использовать как входную строку, так и соответствующую строку при определении ... str1len - $lev) / $str1len; } else { $pct = ($str2len - $lev) / $str2len; } $pct = $pct * 100;

PHP - Поисковый массив предложений для поискового запроса(ов)?

Итак, предположим, что у меня есть простой набор предложений. Каков был бы наилучший способ поиска на основе пользовате ... т.д.) Однако я обеспокоен тем, что этот метод, хотя, возможно, и умный, может быть трудоемким с точки зрения вычислений.