Разбирайте элементы ленты на узлы, но также получайте полный html-код по ссылке, очищая сайт


Я использую каналы для создания узлов из rss-канала. Я также использую feeds imagegrabber для захвата изображения с веб-страницы. Но я, кажется, не могу перейти по ссылкам на каждый элемент и очистить его.

В лентах обычно отображается только текст тизера, но я хочу очистить страницу с полным текстом и сохранить его.

Может ли кто-нибудь объяснить мне, как это делается?

Вот пример канала: http://feeds .washingtonpost.com/rss/homepage

 2
Author: tecjam, 2012-08-06

1 answers

На данный момент это кажется невозможным, поэтому я использовал каналы Yahoo для создания нового rss-канала на основе оригинала, очистил всю страницу для каждого элемента rss и заменил описание содержанием полной статьи.

 0
Author: tecjam, 2012-08-09 13:39:26