Разбирайте элементы ленты на узлы, но также получайте полный html-код по ссылке, очищая сайт
Я использую каналы для создания узлов из rss-канала. Я также использую feeds imagegrabber для захвата изображения с веб-страницы. Но я, кажется, не могу перейти по ссылкам на каждый элемент и очистить его.
В лентах обычно отображается только текст тизера, но я хочу очистить страницу с полным текстом и сохранить его.
Может ли кто-нибудь объяснить мне, как это делается?
Вот пример канала: http://feeds .washingtonpost.com/rss/homepage
2
1 answers
На данный момент это кажется невозможным, поэтому я использовал каналы Yahoo для создания нового rss-канала на основе оригинала, очистил всю страницу для каждого элемента rss и заменил описание содержанием полной статьи.
0
Author: tecjam, 2012-08-09 13:39:26