Hace unas semanas, a raíz de la lectura de un post, empecé a trastear por Yahoo! pipes y me quedé con las ganas de hacer alguna cañería con las fuentes de información sobre biblioteconomía y documentación, propias y ajenas, y otras publicaciones web relacionadas.

Hoy ha sido el día, ya está disponible Documentapipe, una colección de feeds sobre bid que pueden seguirse mediante rss. No están todos los que son ni son todos los que están (podéis verlos en la columna de la derecha donde pone ”sources”), al fin y al cabo en una versión alfa, por así decirlo porque es la primera que hago. Es una ”pipe” pública, es decir, cualquiera consultarla y suscribirse al rss, y si tiene un id de yahoo! puede clonar la pipe y mejorarla, cosa que agradeceríamos todos! :)

Al ir montando la pipe me he encontrado con varios ”problemillas”. Por ejemplo, los distintos formatos de sindicación hacen que no todos los items, los post, estén descritos por los mismo atributos, por lo que a la hora de ordenarlos -sort- el resultado no era el esperado.

Otra curiosidad es la de Documenea. Con la primera versión de la pipe, al incluir el rss resultante en mi lector de feeds, las entradas de Documenea se me actualizaban una y otra vez, a pesar de que había puesto que filtros para no duplicar los títulos. No sé si es por el hecho de que ”menear” significa lincar una noticia (no lo sé, nunca he ”meneado” nada…) y el rss entiende que es una nueva noticia. No estoy muy segura de esto pero, por si acaso, he limitado los duplicados a post que no tengan el mismo link y parece que ha funcionado…

Otra aventura ha sido el formato de salida de datos. Después de solventar lo de ordenar los post venía la parte de mostrar la fuente, para que en el rss no pusiera ”documentapipe” como fuente y se identificara a los autores de las entradas en los datos mostrados por el rss. Después de unas cuantas averiguaciones sobre expresiones regulares en perl (o sea, de copiar y pegar unos ejemplos de los que saben hacer algo con eso) he logrado que salga el nombre del autor/a, algo no tan fácil cuando este valor no esta siempre identificado con la misma etiqueta (dc:creator; author.name)…

En realidad mi idea era que apareciera la fuente original, es decir, conseguir que de toda la url que forma el enlace al post, se tomara la parte que identifica al host y poner este dato como fuente. Pero no he sido capaz… yo creo que se debe poder hacer con las fantásticas expresiones regulares en perl, pero es sólo una intuición…

Leave a Reply

XHTML: You can use these tags: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>