Существует ли определение схемы для реестров доменных имен?


Я работаю над сервисом, который, среди прочего, проверяет предоставленную пользователем информацию на соответствие данным, полученным через WHOIS. Большинство транзакций достаточно хорошо обрабатываются несколькими простыми проверками, но существует длинный список записей, структура которых отличается от большинства и требует дорогостоящего ручного вмешательства.

Я нашел определения для самого протокола WHOIS (RFC 3912), но ничего о схеме (схемах) возвращаемых данных. Делает ли такое вещь существует, и если да, то где?

Author: Ghillie Dhu, 2016-06-06

2 answers

Ваш вопрос зависит от ДВУ, для которого вы запрашиваете доменные имена через whois. Большинство рДВУ, и особенно те, которые были созданы в 2012 году, должны соответствовать формату, утвержденному ICANN. Однако у ccTLD нет таких обязательств, и в основном каждый из них делает свое дело.

В некотором будущем RDAP может заменить или, по крайней мере, сосуществовать с whois, и RDAP использует определенную структуру JSON для ответов, поэтому ее легче анализировать (она была создана именно для этого, среди прочего).

Также в зависимости от TLD у вас может быть доступ к другим структурам данных и/или источникам. Например, некоторые реестры предоставляют открытые данные (но не обязательно свежие в реальном времени).

Опять же, без соответствующих ДВУ трудно дать вам индивидуальные ответы.

 0
Author: Patrick Mevzek, 2017-04-04 18:54:49

Нет схемы, например, данных и формата, которые возвращаются с помощью запроса whois. Данные Whois обычно возвращаются в виде простого текста, предназначенного для чтения человеком. Компании, которые анализируют данные whois для извлечения из них ключевой информации, обычно используют поиск по регулярным выражениям для определения имен ключевых полей в строке и извлечения данных после нее для анализа данных. Существует ряд онлайн-сервисов, предоставляющих программные api-сервисы whois, которые значительно улучшили анализ данных whois и возврат их в виде файла XML или JSON. Похоже, это то, что вы, возможно, ищете.

 1
Author: Chris Rutherfurd, 2016-07-06 12:10:23