Estoy intentando desarrollar una aplicación para unas jornadas de software libre en mi uni. El programa lo que hace es obtener los contenidos de una web y mostrarlos (mucho más simple que un lector RSS y sólo para una web en concreto). La forma que se me ha ocurrido y que ya he utilizado otras veces consiste en descargar el código fuente de la página, cargarlo en una variable e ir "interpretando"* el código.
*Realmente lo que hago es ir troceando la variable buscando etiquetas conocidas. Por ejemplo:
<item>
<title><![CDATA[Tres fragmentos de Planet 51]]></title>
<link>http://www.cineol.net/noticias/6978_Tres-fragmentos-de-Planet-51</link>
<description><![CDATA[ ]]></description>
<content:encoded><![CDATA[<p> </p>]]></content:encoded>
<pubDate>Mon, 23 Nov 2009 23:17:28 +0000</pubDate>
</item>
Buscaría dentro de la variable esta cadena
<title><![CDATA[ y cortaría a partir de ahí hasta encontrarme con
]></title>, luego buscaría
<link> hasta
</link> y así sucesivamente.
No sé si me he explicado con claridad, pero este método me ha funcionado (aunque con muchas menos etiquetas). El caso es que mi profesor me ha dicho que es muy poco efectivo, feo, confuso... y que no es un buen ejemplo de programación y menos aún un código para mostrar al público
ah, y que soy un guarrete programando
¿Qué otras formas se os ocurre de hacer algo así? GRACIAS!!!