Trang vtc.vn (lấy link từ RSS) em đã sửa lại phần lấy nội dung thành:
<parse_article>
<![CDATA[var d = new Document(article.url);
article.body = d.getElementsByAttr("div","id","pageContent")[0].outerHTML;
]]>
</parse_article>
nhưng không hiểu sao có trang thì lấy được toàn bộ nội dung, có...