similarity

Расстояние Левенштейна: как лучше обрабатывать слова, меняющие позиции?

Я добился некоторого успеха в сравнении строк с помощью функции PHP Левенштейна. Однако для двух строк, содержащих по ... , но очень плохо, если вы поменяете порядок слов, которые кажутся обычными в школе: "колледж ххх" против "колледжа ххх".

Что такое статья "Оливер [1993]", описывающая алгоритм PHP для вычисления сходства текста?

В библиотеке PHP есть функция similar_text(). Документация (http://php.net/manual/en/function.similar-text.php ) говор ... howthread.php?t=41089 , и я думаю, что эта информация взята из документации PHP. Кто-нибудь знает, что это может быть?

Косинусное сходство против расстояния Хэмминга [закрыто]

Чтобы вычислить сходство между двумя документами, я создаю вектор признаков, содержащий термин частоты. Но затем, для с ... учшие результаты, если отфильтруете стоп-слова или общие слова? Я надеюсь, что вы сможете мне помочь. Заранее спасибо!

Как найти похожее слово для слова с ошибкой в PHP?

Я объясню свою проблему: У меня есть таблица базы данных с именем country. Он состоит из двух столбцов: ID и name. ... ь в написании скрипта, который делает предложения из БД, содержащие похожие слова, такие как: париж, паредес,... и т.д.

Сравните 5000 строк с PHP Levenshtein

У меня есть 5000, иногда больше, строк уличных адресов в массиве. Я хотел бы сравнить их всех с Левенштейном, чтобы най ... состоит в том, чтобы найти похожие записи (и устранить дубликаты) на основе предоставленных пользователем адресов улиц.

Сравнение изображений с php + gd

Каков наилучший подход к сравнению двух изображений с помощью php и библиотеки Graphic Draw (GD)? Это сценарий: А ... k, Gmagick или Cairo для php, но я бы предпочел избегать использования других языков, кроме php. Заранее благодарю.

Ускорение левенштейна /аналогичный текст на PHP

В настоящее время я использую similar_text для сравнения строки со списком ~50 000, который работает, хотя из-за количе ... ю кто-то опубликовал в руководстве, выглядит интересной. Я упускаю что-то, что могло бы сделать это значительно быстрее?

Похожие изображения - как их сравнить

У меня более 1,3 миллиона изображений, которые я должен сравнить друг с другом, и добавляется несколько сотен в день. ... ки серого, сделайте хэш этих файлов и используйте его для сравнения. Если я добьюсь успеха, я опубликую код/ответ здесь

похожий текст на PHP

У меня есть PHP-массив примерно такого вида $array = array("foo", "bar", "hallo", "world", "fooo", "bar1", "hall_o", ... 0 элементов, поэтому моя текущая логика очень дорогая. Есть какое-нибудь направление, чтобы справиться с этим лучше?

Определение вероятности плагиата в нескольких записях с использованием PHP

Я работаю над веб-приложением, которое отслеживает записи в службе поддержки. Мы хотим найти способ запретить людям ко ... lar_text(), так как мне нужно сравнивать несколько записей друг с другом, а не две строки. Любой вклад приветствуется.

сравнение похожих текстовых строк /целых чисел

Это мой первый пост здесь, так что приветствую всех! Я пытаюсь написать правило, чтобы просто защитить свой сайт от н ... larity < 90) { // add the record } else { // dont add anything } Проблема заключается в следующем: если ($сходство

Сравнение стилей "Викторины личности" [PHP] [закрыто]

Я пытаюсь придумать эффективный или разумный алгоритм, чтобы взять результаты теста, представленного пользователем, и с ... D"), с ответами каждого кандидата и измерить сходство таким образом? Есть какие-нибудь предложения? Большое спасибо.