<?xml version="1.0" encoding="UTF-8"?>
<rss
version="2.0"
xmlns:content="http://purl.org/rss/1.0/modules/content/"
xmlns:wfw="http://wellformedweb.org/CommentAPI/"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:atom="http://www.w3.org/2005/Atom"
xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
>
<channel><title>Javier Casares</title>
<atom:link href="http://javiercasares.com/feed/" rel="self" type="application/rss+xml" /><link>http://javiercasares.com</link>
<description>Acelero Proyectos de Internet haciendo cosas que otros no hacen...</description>
<lastBuildDate>Tue, 08 May 2012 17:49:22 +0000</lastBuildDate>
<language>en</language>
<sy:updatePeriod>hourly</sy:updatePeriod>
<sy:updateFrequency>1</sy:updateFrequency>
<generator>http://wordpress.org/?v=3.3.2</generator>
<atom:link rel="hub" href="http://pubsubhubbub.appspot.com"/>		<item><title>Animales en Blanco y Negro: primero el Panda, ahora el Pingüino</title><link>http://javiercasares.com/blog/animales-en-blanco-y-negro-primero-el-panda-ahora-el-pinguino/</link>
<comments>http://javiercasares.com/blog/animales-en-blanco-y-negro-primero-el-panda-ahora-el-pinguino/#comments</comments>
<pubDate>Tue, 01 May 2012 10:23:14 +0000</pubDate>
<dc:creator>Javier Casares</dc:creator>
<category><![CDATA[Search Engine Optimization]]></category>
<guid
isPermaLink="false">http://javiercasares.com/?p=3838</guid>
<description><![CDATA[Hace un año conocíamos una faceta desconocida de uno de los animales que considerábamos más pacíficos y carismáticos: el Panda. Pero Google le ha dado otro sentido a este entrañable animalito convirtiéndose en uno de los mayores dolores de cabeza &#8230; <a
href="http://javiercasares.com/blog/animales-en-blanco-y-negro-primero-el-panda-ahora-el-pinguino/">Sigue leyendo <span
class="meta-nav">&#8594;</span></a>]]></description>
<content:encoded><![CDATA[<p>Hace un año conocíamos una faceta desconocida de uno de los animales que considerábamos más pacíficos y carismáticos: el Panda. Pero Google le ha dado otro sentido a este entrañable animalito convirtiéndose en uno de los mayores dolores de cabeza para algunos en la red de redes (porque para otros sigue siendo ese animalito cariñoso que nos ha hecho seguir subiendo y subiendo&#8230;). Ahora lleva a nuestras vidas otro animal que, al igual que el Panda, vive su vida en colores blanco y negro: el Pingüino. Y es que, como en la informática hay sólo ceros y unos, parece que en Mountain View tampoco hay términos medios: todo es blanco o negro.</p><p>La semana pasada le mandaba un correo a varios clientes, amigos, proyectos con los que me he encariñado (llamadlo como queráis) explicando algunas cosas que tenían que cambiar lo antes posible. Yo les decía que antes del 1 de mayo, pero prácticamente el jueves ya tenía que estar todo hecho. ¿Y qué decía en ese correo? Pues eso me lo reservo, a medias.</p><p>Como ya sabéis Google en los últimos años ha estado haciendo muchísimos esfuerzos para &#8220;aumentar la calidad de sus resultados&#8221;. Estos esfuerzos van muy ligados a reducir (por no decir eliminar) el peso del PageRank (el tradicional de cuantos más enlaces mejor) para llevarlo al de &#8220;sólo valen los enlaces de calidad y con sentido, y los que son malos, quitan puntos&#8221;. Por otro lado también ha habido cambios con respecto a los propios parámetros dentro de los sitios web, enfocándose principalmente en que haya &#8220;mucha chicha&#8221; en las páginas, pero que sea comestible, nada de <em>fast food</em>. Esto viene a una cosa sencilla&#8230; mucha gente se ha enfocado a eso del <em>link juice</em> (una gilipollez como cualquier otra) y lo basaba en los enlaces, y no en las páginas. Se puede hacer, pero sólo la gente inteligente lo hace bien. Para acabar también se le está comenzando a dar ese peso a la personalización que hace un año no teníamos, lo que significa que el factor tiempo también ha vuelto a resucitar, ya que lo social va ligado a la temporalidad.</p><p>¿Qué significa todo esto en términos del sitio web? Pues básicamente hay tres factores a revisar que son los que en general están <em>molestando</em> al G-gante. Para comenzar el tema de los enlaces hay que tener presente algo que siempre he dicho: con un enlace desde un sitio es suficiente; me explico. No sirve de nada que un sitio web te ponga el mismo enlace a la página principal desde todas sus páginas. Tener 50.000 enlaces no va a ayudarte, al revés, ahora esos que lo tienen así en general están teniendo problemas. Por otro lado eso no significa que no se puedan tener 20 enlaces a 20 páginas distintas de tu sitio web.</p><p>Siguiendo con los enlaces, aunque en este caso ya afectando propiamente al sitio, algo que tampoco quiere Google es tener mucho linking interno en tu sitio que no aporta. Como ya sabemos (y si no lo sabes, retírate), Google controla la calidad de los enlaces entre otras cosas mediante herramientas como Google Analytics. Esto significa que poner una decena de enlaces en un post, entrada, artículo, noticia (o sea, contenido) a otras partes de tu sitio web sin sentido, es decir, ponerlos de forma automatizada mediante plugins o algoritmos poco inteligentes ya no ayuda (en general he tenido siempre dudas de que hacerlo de forma automatizada tenga algún sentido).</p><p>Para acabar los pies de página. Primero, al menos siguiendo la <a
href="http://es.wikipedia.org/wiki/Ley_Org%C3%A1nica_de_Protecci%C3%B3n_de_Datos_de_Car%C3%A1cter_Personal_de_Espa%C3%B1a">LOPD</a> y <a
href="http://es.wikipedia.org/wiki/Ley_de_Servicios_de_la_Sociedad_de_Informaci%C3%B3n_de_Espa%C3%B1a">LSSI</a> no es necesario tener en todas y cada una de las páginas de un sitio enlaces a la información legal, al quienes somos y esas cosas&#8230; sino que con que esté en la página principal es suficiente. Por otro lado, y siguiendo con lo que comentaba antes de los enlaces internos absurdos&#8230; ¿tiene algún sentido tener en el pie de página enlaces a todas las webs &#8220;de un grupo de sitios&#8221;? Eso en general no aporta nada más que generar enlaces sin valor.</p><p>Con respecto a los contenidos, bueno, hace unas semanas cuando volví de Lyon ya comenté la importancia de escribir bien, del léxico, la gramática&#8230; la única forma de saber si algo es de calidad es simplemente escribiendo cosas que tienen sentido, que tienen lógica y tienen relevancia&#8230; así las máquinas pueden entender qué narices estamos queriendo explicar o decir.</p><p>También hay que tener presente que, como ya pasó con Google Panda, es muy probable que Google Penguin evolucione, y que lo que estamos viendo es simplemente la punta del iceberg, ese iceberg desde donde los tan geniales pingüinos se lanzan como un tobogán hasta llegar al mar.</p><p>varias personas me han preguntado estos días sobre este nuevo cambio en el algoritmo de Google. En general en mis sitios todo va subiendo, y es que, no me cansaré de decirlo: <strong>sólo hay una forma de salir bien en los resultados de búsqueda, hacer las cosas bien</strong>.</p>
]]></content:encoded>
<wfw:commentRss>http://javiercasares.com/blog/animales-en-blanco-y-negro-primero-el-panda-ahora-el-pinguino/feed/</wfw:commentRss>
<slash:comments>12</slash:comments>
</item>
<item><title>WebPerf Barcelona: WordPress</title><link>http://javiercasares.com/blog/webperf-barcelona-wordpress/</link>
<comments>http://javiercasares.com/blog/webperf-barcelona-wordpress/#comments</comments>
<pubDate>Thu, 26 Apr 2012 16:55:22 +0000</pubDate>
<dc:creator>Javier Casares</dc:creator>
<category><![CDATA[Barcelona]]></category>
<category><![CDATA[WebPerf]]></category>
<guid
isPermaLink="false">http://javiercasares.com/?p=3834</guid>
<description><![CDATA[En unos minutos comenzará el primer #WebPerf en España, organizado desde WebPerf.es por mi mismo y donde yo voy a ser el primer ponente (por las cosas del directo, ya sabéis). Aunque las carreras de última hora son siempre previsibles, &#8230; <a
href="http://javiercasares.com/blog/webperf-barcelona-wordpress/">Sigue leyendo <span
class="meta-nav">&#8594;</span></a>]]></description>
<content:encoded><![CDATA[<p><img
src="http://javiercasares.net/uploads/webperf-150x150.jpg" alt="" title="webperf" width="150" height="150" class="alignright size-thumbnail wp-image-3696" />En unos minutos comenzará el primer <a
href="https://twitter.com/search/realtime/%23webperf">#WebPerf</a> en España, organizado desde <a
href="http://webperf.es/">WebPerf.es</a> por mi mismo y donde yo voy a ser el primer ponente (por las cosas del directo, ya sabéis).</p><p>Aunque las carreras de última hora son siempre previsibles, tengo un rato para comentar varias cosas sobre el evento que, como bien dice el título habla de WordPress, de cómo conseguir que el WordPress consiga un alto rendimiento. Os dejo con la <a
href="http://javiercasares.net/uploads/webperf-wordpress.pdf">presentación para descargar</a> y dejo el <a
href="http://new.livestream.com/LaSalleBCN/JavierCasares"><strong>canal en directo</strong></a> aunque es una prueba piloto, por lo que si hay algún problema, lo siento de ante mano, seguramente poco podré hacer, aunque intentaré que sea posible que se vea (y sobre todo, que se oiga)&#8230;</p><p>Reconozco que estoy un poco nervioso, no tanto por la charla (no es ni la primera ni la última, aunque como siempre la he preparado pero improvisaré algo) sino por el hecho de organizar un evento después de tantos años sin hacer nada. Prácticamente desde el <a
href="http://www.ojobuscador.com/sobre/congreso-2007-madrid/">congreso OJObuscador 2007</a> que no llevaba a la realidad algo como esto. Además, gente a la que aprecio mucho va a estar ahí, y, no puedo fallar :)</p><p>Hala, ¡mucha mierda!</p>
]]></content:encoded>
<wfw:commentRss>http://javiercasares.com/blog/webperf-barcelona-wordpress/feed/</wfw:commentRss>
<slash:comments>2</slash:comments>
</item>
<item><title>Plugin para WordPress y Varnish</title><link>http://javiercasares.com/blog/plugin-wordpress-varnish/</link>
<comments>http://javiercasares.com/blog/plugin-wordpress-varnish/#comments</comments>
<pubDate>Thu, 19 Apr 2012 09:28:37 +0000</pubDate>
<dc:creator>Javier Casares</dc:creator>
<category><![CDATA[Varnish]]></category>
<category><![CDATA[WordPress]]></category>
<guid
isPermaLink="false">http://javiercasares.com/?p=3829</guid>
<description><![CDATA[Acabo de parir&#8230; han sido 9 meses largos (en serio, he estado, ahora que lo pienso, 9 meses desarrollando cosas sobre este tema) pero han valido la pena porque hoy he subido al repositorio oficial mi primer plugin: WordPress Varnish &#8230; <a
href="http://javiercasares.com/blog/plugin-wordpress-varnish/">Sigue leyendo <span
class="meta-nav">&#8594;</span></a>]]></description>
<content:encoded><![CDATA[<p>Acabo de parir&#8230; han sido 9 meses largos (en serio, he estado, ahora que lo pienso, 9 meses desarrollando cosas sobre este tema) pero han valido la pena porque hoy he subido al repositorio oficial mi primer plugin: <a
href="http://wordpress.org/extend/plugins/wordpress-varnish-as-a-service/">WordPress Varnish as a Service</a>.</p><p>Aunque en la página del repositorio no hay mucha información, he preparado una <a
href="http://javiercasares.com/wp-varnish-aas/">página interna sobre este mismo tema</a> en el que hay algo más de información, como por ejemplo algunas funcionalidades, los idiomas a los que está traducido&#8230;</p><p>Hace unas semanas ya os comenté que estábamos preparando un servicio de <a
href="http://javiercasares.com/blog/varnish-for-wordpress-as-a-service/">Varnish para WordPress como Servicio</a> que básicamente multiplica enormemente la velocidad de carga de las páginas (el WPO y el SEO, vamos). Y como contra prestación ha salido un bonito plugin.</p><p>Aunque ha habido varias versiones anteriores 8a lo mejor algún día las subo por tenerlas ahí almacenadas) la versión 1.0.1 funciona bien, es estable y hace lo que tiene que hacer. De todas formas en mi cabeza tengo bastante claro el <em>roadmap</em> hasta la versión 2.0. Además, seguramente lance otro plugin (complementario al del Varnish) para que WordPress funcione perfectamente sin problemas, ya que Varnish es un proxy y eso implica cosas&#8230;</p><p>Además, he tenido el gusto de poder presentárselo a la gente de Varnish Software y junto a ellos y otras personas lo iré evolucionando al máximo.</p><p>Si alguien tiene sugerencias, quiere probar el Varnish como Servicio o cualquier otra cosa, buscad en el menú que pone &#8220;contacto&#8221; y os aparecerá mi correo ;)</p>
]]></content:encoded>
<wfw:commentRss>http://javiercasares.com/blog/plugin-wordpress-varnish/feed/</wfw:commentRss>
<slash:comments>3</slash:comments>
</item>
<item><title>El PageRank ha muerto</title><link>http://javiercasares.com/blog/el-pagerank-ha-muerto/</link>
<comments>http://javiercasares.com/blog/el-pagerank-ha-muerto/#comments</comments>
<pubDate>Wed, 18 Apr 2012 09:06:35 +0000</pubDate>
<dc:creator>Javier Casares</dc:creator>
<category><![CDATA[Mis Cosas]]></category>
<category><![CDATA[Search Engine Optimization]]></category>
<guid
isPermaLink="false">http://javiercasares.com/?p=3738</guid>
<description><![CDATA[No sé si sabes que desde hace unos años Google ya no ostenta en exclusiva la patente del PageRank; me explico. Cuando Larry Page, por aquellos 1997-1998 patentaba el PageRank, la fórmula que básicamente dice que el peso de los &#8230; <a
href="http://javiercasares.com/blog/el-pagerank-ha-muerto/">Sigue leyendo <span
class="meta-nav">&#8594;</span></a>]]></description>
<content:encoded><![CDATA[<p>No sé si sabes que desde hace unos años Google ya no ostenta en exclusiva <a
href="http://javiercasares.com/blog/primera-patente-google-backrub/">la patente del PageRank</a>; me explico. Cuando Larry Page, por aquellos 1997-1998 patentaba el PageRank, la fórmula que básicamente dice que el peso de los enlaces hace que una página tenga relevancia lo hizo no para él o para <a
href="http://www.google.com/intl/es/about/corporate/company/">Google Inc.</a> sino para la <a
href="http://www.stanford.edu/">Universidad de Stanford</a>.</p><p>Hace unos años la patente quedó fuera de los ámbitos de uso exclusivo por parte de Larry y su compañía, lo que supone que, aunque tienen derechos de uso, el objetivo a muy corto plazo es no usar dicha estrategia ya que hoy en día ya no es totalmente suya.</p><p>Ahora en 2012 todos los buscadores utilizan el concepto de que un sitio con enlaces cobra relevancia pero no como hasta ahora lo teníamos entendido, lo que significa que algo está cambiando. Es decir, tanto Bing, como Baidu o Yandex utilizan el concepto del PageRank (adaptado a su manera) pero no con las bases propias del PageRank.</p><p>Estos días que he estado en el <a
href="http://www2012.wwwconference.org/">www2012</a>, en el que estaba Bing, Google, Baidu, Yandex, Yahoo! y seguramente otros tantos que ni fui capaz de cruzarme, ninguno de ellos hacía referencia a ese tema de dar relevancia a los buscadores en base a los enlaces, sino que todos comentaban que su trabajo estos últimos años ha sido y sigue siendo el de dar relevancia en base a la calidad. El problema es definir qué se entiende por calidad en Internet (algo en lo que Ricardo Baeza hizo mención en varias ocasiones su charla). En general la calidad va definida por cosas muy elementales como simplemente escribir bien, tener los menores errores ortográficos, semánticos y gramaticales. Por otro lado cada vez más y más se habla de la personalización, ese elemento que hace que el SEO dependa de los usuarios y no de las máquinas.</p><p>El SEO en general es algo que los buscadores tienen presente y se premia si se hace todo correctamente. El SEO &#8220;de la antigua escuela&#8221; ya no tiene por dónde evolucionar más que no sea &#8220;hacer las cosas bien&#8221;. Si sigues las normas, generas contenidos, aportas valor a tus usuarios y, de rebote, generas un buzz suficiente en la red no necesitas más. El problema (y la solución), una vez más, es hacer las cosas bien.</p><p>En muchos proyectos en los que estoy trabajando no se aprecian los detalles, esas excepciones que los programadores intentamos tratar en el día a día de un producto (que si un <em>if</em> por aquí que si un <em>if</em> por allá). Hace poco he tenido la posibilidad de comparar un desarrollo que hice hace algunos años del que estoy más que orgulloso (en el sentido de que creé un producto que lo que hacía lo hacía bien y que desde el punto de vista SEO era genial) con el mismo producto desarrollado por otra gente que hace lo mismo pero se ha hundido en la miseria a la hora de compararlo desde el punto de vista SEO; los contenidos son los mismos, se supone que tienen ahora mejores enlaces y de más calidad que antes, pero pequeños fallos de desarrollo han impedido que eso en vez de ir para arriba vaya para abajo. Y como digo con &#8220;pequeños&#8221;, pero con gran impacto. Esa es la diferencia de &#8220;hacer las cosas bien&#8221;.</p><p>Es posible que muchos penséis que una vez más se me ha ido la cabeza (algo que, por otra parte, me la resbala bastante), o que el título del artículo es amarillista o lo que queráis, pero soy viejo, llevo muchos años trabajando por y para la red de redes y las veo venir de lejos. Otros de los pre-2000 también opinan como yo. Internet está en su plena adolescencia como red mundial, estamos en un punto de efervescencia en cuanto a proyectos, desarrollo y estándares. Hacía 10 años que no teníamos una nueva versión de HTML, que viene con muchísimos añadidos alrededor como los microdatos, los canvas, navegadores que intentan ir por delante del ritmo oficial&#8230;</p><p>Al final, como ya decía en la <a
href="http://javiercasares.com/seo/" title="Guía SEO">Guía SEO</a> y como debería poner en la <a
href="http://javiercasares.com/wpo/" title="Guía WPO">Guía WPO</a> todo es <a
href="http://javiercasares.com/seo/sentido-comun/" title="Sentido Común">Sentido Común</a>, es adaptarse a las necesidades de cada proyecto, de cada cliente, tener una base bien preparada y sobre todo <strong>hacer las cosas con dos dedos de frente</strong>. La &#8220;crisis&#8221; ha hecho que mucha gente haya venido a Internet y haya entrado como un elefante en una cacharrería, haciendo mucho ruido, pero pocas nueces&#8230; Así que simplemente paciencia, todo llegará y volverá a sus cauces. Eso sí, no esperéis que los buscadores vuelvan a la tecnología de hace 10 años, porque eso es agua pasada.</p>
]]></content:encoded>
<wfw:commentRss>http://javiercasares.com/blog/el-pagerank-ha-muerto/feed/</wfw:commentRss>
<slash:comments>13</slash:comments>
</item>
<item><title>#WWW2012: Resumen de estos días</title><link>http://javiercasares.com/blog/www2012-resumen-final/</link>
<comments>http://javiercasares.com/blog/www2012-resumen-final/#comments</comments>
<pubDate>Tue, 17 Apr 2012 16:37:09 +0000</pubDate>
<dc:creator>Javier Casares</dc:creator>
<category><![CDATA[Eventos]]></category>
<category><![CDATA[Lyon]]></category>
<guid
isPermaLink="false">http://javiercasares.com/?p=3803</guid>
<description><![CDATA[Se acaba mi viaje a Lyon (aunque aún me quedan unas cuantas horas por aquí hasta la vuelta a Barcelona) y me gustaría hacer un pequeño resumen de lo que me ha parecido esta edición (la única en la que &#8230; <a
href="http://javiercasares.com/blog/www2012-resumen-final/">Sigue leyendo <span
class="meta-nav">&#8594;</span></a>]]></description>
<content:encoded><![CDATA[<p>Se acaba mi viaje a Lyon (aunque aún me quedan unas cuantas horas por aquí hasta la vuelta a Barcelona) y me gustaría hacer un pequeño resumen de lo que me ha parecido esta edición (la única en la que he estado) del <a
href="http://www2012.wwwconference.org/">WWW2012</a>.</p><p>El planteamiento de venir al www2012 fue básicamente por los workshops. Había asistido a otras ediciones de los que he estado (con otros nombres y otras cosas, pero básicamente años atrás) y quería seguir en la línea. Además, los que he estado (que consideraba que serían los que más me iban a aportar de todos los que había, que no eran pocos) los organizaban gente que conozco y en la que confío, así que poco podía fallar. Y así ha sido, me han servido para, una vez más, abrir mi mente &#8220;versión SEO&#8221; y poder ver ligeramente hacia dónde van los buscadores los próximos años. Sí, cuando la gente me pregunta que qué va a pasar dentro de 2-4 años en el mundillo de los buscadores en general no me equivoco porque, en eventos como estos aprender en lo que se está trabajando y se trabajará los próximos años.</p><p>Eso sí, una vez más, en algunas ocasiones me veo como el tonto de la clase. A estas charlas en general asisten los ponentes y otros cuantos &#8220;freaks&#8221; más de la temática&#8230; yo ni soy freak ni soy ponente, sino un simple espectador que no cuadra para nada en ello. Y digo esto porque los ponentes suelen ser estudiantes universitarios que exponen de forma más o menos científica trabajos interesantes. Por poner un ejemplo, en 2008-2009 asistí a un par de eventos en los que se hablaba de los microformatos cuando nadie los usaba ni sabía nada de ellos&#8230; ahora a todo el mundo se le hace la boca grande hablando de ello&#8230;</p><p>Quizá la parte negativa es el precio. No es barato asistir al www2012, aunque quizá eso le de cierto nivel, ya que la organización es simplemente gigantesca. Hay gente de todos los países, colores y gustos. A la hora de la comida debíamos de estar más de 2.000 personas tranquilamente. Simplemente espectacular. Eso sí, españoles no he visto ninguno.</p><p>Para acabar con respecto al evento propiamente dicho, me voy con una decena de ideas que no sé si podré aplicar por falta de tiempo. Esta es quizá la peor parte ya que si uno viene aquí y aprende cosas es para aplicarlas. Supongo que lo podré hacer en el momento en el que me encuentre frente a la situación, pero no podré probarlo con tiempo antes. También me voy con algunas conversaciones y ojeadas a los asistentes&#8230; hoy he podido mantener una conversación con una persona que trabaja en uno de los grandes buscadores que me ha confirmado (con silencios) mis teorías SEO. Sé que mi forma de trabajar el SEO es la correcta desde hace años, trabajando a medio-largo plazo, eso sí, y cada vez se confirma más y más. Por otro lado los gigantes de las búsquedas me dan cada vez más miedo: Microsoft Research, Google Research, Baidu y Yandex estaban por todos lados&#8230; y eso dice mucho. Sobre todo he tenido la oportunidad de darme cuenta hacia dónde va Yandex, porque han asistido la mayoría del grupo a las mismas charlas que yo, así que creo que no voy por mal camino&#8230;</p><p>Fuera del evento, me he dado cuenta de que mi inglés sigue flojo en algunos casos&#8230; para empezar hablándolo&#8230; aunque creo que casi ya hablo mejor inglés que catalán, lo que no sé si dice mucho o poco de mi (más bien lo segundo). Por otro lado he aprendido que el inglés-francés y el inglés-japonés son mucho más difícil que el inglés-afroamericano. Lo siento, pero soy incapaz de entender el francés, no consigo pillar ni una (y que nadie me diga que se parece al catalán, porque no es un tema de escritura, sino de pronunciación así con <em>boquita de piñón</em> que no se les entiende nada (si hay algún francés en la sala que no se lo tome a mal, es que simplemente no me empano de nada).</p><p>Y para acabar Lyon&#8230; aysh, Lyon&#8230; si no fuera por el francés (es coña&#8230;). Es un sitio que está bien&#8230; pero que en días grises no mola nada&#8230; hay mucho verde, pero las nubes lo ponen todo muy feo, y lo del viendo cerca del río es que no tiene nombre&#8230; ayer paseaba al lado de la <a
href="http://www.interpol.int/">Interpol</a> (¡sí, señores, existe!). Hoy por suerte está haciendo un muy decente, con solecito y un poco de fresco y la verdad es que esto luce mucho mejor, y muy distinto. Además, estar cerca del <em>Parc de la Tête d&#8217;Or</em>, el mayor parque (dentro de una ciudad de Francia), es algo que también se agradece.</p><p>En fin, como resumen, me vuelvo con un buen sabor de boca, con la experiencia de uno de los eventos de Internet más importantes del mundo y con otro punto en el mapa en el que ya puedo situar una marca de visitado.</p>
]]></content:encoded>
<wfw:commentRss>http://javiercasares.com/blog/www2012-resumen-final/feed/</wfw:commentRss>
<slash:comments>0</slash:comments>
</item>
<item><title>#WWW2012: CrowdSearch 2012, crowdsourcing for multimedia applications</title><link>http://javiercasares.com/blog/www2012-crowdsearch-2012-multimedia-applications/</link>
<comments>http://javiercasares.com/blog/www2012-crowdsearch-2012-multimedia-applications/#comments</comments>
<pubDate>Tue, 17 Apr 2012 13:35:35 +0000</pubDate>
<dc:creator>Javier Casares</dc:creator>
<category><![CDATA[Eventos]]></category>
<category><![CDATA[Lyon]]></category>
<category><![CDATA[Search Engine Optimization]]></category>
<guid
isPermaLink="false">http://javiercasares.com/?p=3786</guid>
<description><![CDATA[Último bloque de presentaciones del día, en este caso va a ir relacionado con la inteligencia colectiva en contenidos y temas multimedia. Para comenzar tenemos PodCastle and Songle: Crowdsourcing-Based Web Services for Retrieval and Browsing of Speech and Music Content &#8230; <a
href="http://javiercasares.com/blog/www2012-crowdsearch-2012-multimedia-applications/">Sigue leyendo <span
class="meta-nav">&#8594;</span></a>]]></description>
<content:encoded><![CDATA[<p>Último bloque de presentaciones del día, en este caso va a ir relacionado con la inteligencia colectiva en contenidos y temas multimedia.</p><p>Para comenzar tenemos <a
href="http://javiercasares.net/uploads/crowdsearch-goto.pdf"><strong>PodCastle and Songle: Crowdsourcing-Based Web Services for Retrieval and Browsing of Speech and Music Content</strong></a> de <em>Masataka Goto</em>, <em>Jun Ogata</em>, <em>Kazuyoshi Yoshii</em>, <em>Hiromasa Fujihara</em>, <em>Matthias Mauch</em> y <em>Tomoyasu Nakano</em>).</p><p>Existen los sitios <a
href="http://podcastle.jp/">PodCastle</a> (para voz hablada) y <a
href="http://songle.jp/">Songle</a> (para música) que se usan para el reconocimiento multimedia. El primero, por ejemplo, permite la lectura de un contenido e interpretar sus textos. Los usuarios pueden ayudar y colaborar corrigiendo las palabras que sean erróneas, eligiendo, por ejemplo, entre distintas palabras o simplemente corrigiéndolas. Entre las cosas interesantes son las interfaces que este sistema ofrece con formas alternativas. Además, tras corregir, el sistema aprende por lo que se mejora el performance del sistema.</p><p><a
href="http://javiercasares.net/uploads/2012-04-17-16.16.17.jpg"><img
src="http://javiercasares.net/uploads/2012-04-17-16.16.17-550x328.jpg" alt="" title="2012-04-17 16.16.17" width="550" height="328" class="aligncenter size-large wp-image-3806" /></a></p><p>Una de las razones por las que los usuarios entran en este sitio es por la interfaz que se propone y por el altruismo de los usuarios. Otra razón es que en algunos casos aparecen personajes famosos y los usuarios no pueden tolerar que haya errores en sus traslaciones a texto.</p><p>A diferencia de los cambios en la Wikipedia, un cambio es sólo para un contenido; en este caso un cambio implica una mejora en toda el sistema que mejora los trabajos futuros.</p><p>La otra herramienta, Songle, permite el análisis musical con un sistema visual de pistas, tempos, etc&#8230; Con este sistema se pueden detectar coros, melodía, tempos&#8230; gracias a esto es fácil encontrar partes de una canción por similitud.</p><p>La siguiente presentación es <a
href="http://javiercasares.net/uploads/crowdsearch-bozzon.pdf"><strong>A Framework for Crowdsourced Multimedia Processing and Querying</strong></a> (de <em>Alessandro Bozzon</em>, <em>Ilio Catallo</em>, <em>Eleonora Ciceri</em>, <em>Piero Fraternali</em>, <em>Davide Martinenghi</em> y <em>Marco Tagliasacchi</em>)</p><p>En general las máquinas no tienen la capacidad para entender el material multimedia, lo que provocan baja fiabilidad, principalmente en vídeo. Un sistema que se ha probado es por ejemplo el de la detección de logos (marcas registradas) dentro de un vídeo, por ejemplo para detectar problemas de patentes o de usos indebidos.</p><p>Una de las cosas que se ha trabajado a nivel de inteligencia colectiva es la selección de logos dentro de una imagen, y por otra parte la separación de posibles versiones de logos.</p><p><a
href="http://javiercasares.net/uploads/2012-04-17-16.40.50.jpg"><img
src="http://javiercasares.net/uploads/2012-04-17-16.40.50-550x328.jpg" alt="" title="2012-04-17 16.40.50" width="550" height="328" class="aligncenter size-large wp-image-3807" /></a></p><p>Continuamos con <a
href="http://javiercasares.net/uploads/crowdsearch-harris.pdf"><strong>An Evaluation of Search Strategies for User-Generated Video Content</strong></a> (de <a
href="mailto:christopher-harris@uiowa.edu"><em>Christopher G. Harris</em></a>)</p><p>Hacer búsquedas en vídeos generados y subidos por los usuarios es complejo. Por ejemplo, los tags no están penadas para la búsqueda, sólo hay 13 categorías, los comentarios son encontrables pero tienen pocas visualizaciones (0,16%, 1 de cada 600 deja un comentario) y en general no son útiles&#8230; en resumen: hay mucho ruido.</p><p><a
href="http://javiercasares.net/uploads/2012-04-17-17.00.06.jpg"><img
src="http://javiercasares.net/uploads/2012-04-17-17.00.06-550x328.jpg" alt="" title="2012-04-17 17.00.06" width="550" height="328" class="aligncenter size-large wp-image-3808" /></a></p><p>Una de las cosas que se estudian es la posibilidad de realizar una consulta y que estudiantes, usuarios en general o los resultados directos de Youtube ofrecen. Una vez esto, hay que plantearse si analizar o no los resultados también mediante inteligencia colectiva para corregir los vídeos propuestos.</p><p>Para acabar tenemos <a
href="http://javiercasares.net/uploads/crowdsearch-vliegendhart.pdf"><strong>Discovering User Perceptions of Semantic Similarity in Near-duplicate Multimedia Files</strong></a> (de <em>Raynor Vliegendhart</em>, <em>Martha Larson</em> y <em>Johan Pouwelse</em>)</p><p>¿Son estas dos canciones la misma? ¿O estos dos vídeos? Dos vídeos son similares si generan el mismo propósito para un usuario. Una forma de analizarlo pdoría se poniendo a prueba a los usuarios haciendo que elijan, o si creen que varios vídeos de capítulos de series descargables por Torrent son los mismos o no en base a sus nombres.</p>
]]></content:encoded>
<wfw:commentRss>http://javiercasares.com/blog/www2012-crowdsearch-2012-multimedia-applications/feed/</wfw:commentRss>
<slash:comments>0</slash:comments>
</item>
<item><title>#WWW2012: CrowdSearch 2012, methods and tools for crowdsearching</title><link>http://javiercasares.com/blog/www2012-crowdsearch-2012-methods-and-tools/</link>
<comments>http://javiercasares.com/blog/www2012-crowdsearch-2012-methods-and-tools/#comments</comments>
<pubDate>Tue, 17 Apr 2012 11:37:56 +0000</pubDate>
<dc:creator>Javier Casares</dc:creator>
<category><![CDATA[Eventos]]></category>
<category><![CDATA[Lyon]]></category>
<category><![CDATA[Search Engine Optimization]]></category>
<guid
isPermaLink="false">http://javiercasares.com/?p=3785</guid>
<description><![CDATA[Seguimos con las charlas de inteligencia colectiva (más concretamente con su uso en temas relacionados con las búsquedas). Retomamos las charlas con Crowd Sourcing Literature Review in SUNFLOWER (de Sihem Amer-Yahia). La idea es generar contenidos de forma automática en &#8230; <a
href="http://javiercasares.com/blog/www2012-crowdsearch-2012-methods-and-tools/">Sigue leyendo <span
class="meta-nav">&#8594;</span></a>]]></description>
<content:encoded><![CDATA[<p>Seguimos con las charlas de inteligencia colectiva (más concretamente con su uso en temas relacionados con las búsquedas).</p><p>Retomamos las charlas con <a
href="http://javiercasares.net/uploads/crowdsearch-ameryahia.pdf"><strong>Crowd Sourcing Literature Review in SUNFLOWER</strong></a> (de <em>Sihem Amer-Yahia</em>). La idea es generar contenidos de forma automática en base a resumir otros contenidos junto a la inteligencia colectiva.</p><p>La primera parte lo que intenta es encontrar contenidos y buscar contenidos relacionados, generando distintos grupos y palabras clave. La segunda parte es la de generar un resumen de los contenidos (procesar, clasificar, reescribir&#8230;). La última parte es la que afecta a las personas. La idea es que en esta parte los usuarios acaben verificando y reescribiendo la documentación.</p><p><a
href="http://javiercasares.net/uploads/2012-04-17-13.38.58.jpg"><img
src="http://javiercasares.net/uploads/2012-04-17-13.38.58-550x328.jpg" alt="" title="2012-04-17 13.38.58" width="550" height="328" class="aligncenter size-large wp-image-3798" /></a></p><p>Para sacar los documentos se buscan contenidos similares y se basa también en los autores. Gracias a distintas herramientas ya existentes (como MEAD) se pueden extraer los principales conceptos y generar un resumen. La parte más relacionada con los usuarios tiene mucho trabajo por delante, ya que se pueden ajustar mucho los puntos para conseguir mejores contenidos finales. Como ejemplo de este sistema podríamos poner una base de la Wikipedia (podemos ver <a
href="http://stats.wikimedia.org/">datos analíticos</a>).</p><p>Para sacar los datos primero hay que encontrar documentos bien tratados, con temas y sub-temas. Además, han de estar bien relacionados, ya sea mediante palabras clave, información de autoría, sistemas de citas u otra metainformación.</p><p>Seguimos con la siguiente charla <a
href="http://javiercasares.net/uploads/crowdsearch-paritosh.pdf"><strong>Human Computation Must Be Reproducible</strong></a> (de <em>Praveen Paritosh</em>).</p><p>La idea de lo que se ha  comentado hasta ahora es sacar si los datos que se extraen de forma colaborativa son fiables. <a
href="http://www.freebase.com/">Freebase</a> es una especie de Wikipedia pero pensada para máquinas con 23 millones de entidades y 500 millones de relaciones. En general el mayor problema de detección es el de las entidades. Por ejemplo, hay 8 ciudades llamadas San Francisco y hay que discernir de cuál de ellas se trata.</p><p>Hoy en día ¿para qué se usan las &#8220;computadores humanas&#8221;? Para etiquetar imágenes, para determinar relevancia en buscadores, moderar contenidos ofensivos&#8230; Estas personas pueden ser gente pagada (por ejemplo Mechanical Turks) o voluntarios, gente a través de oDesk o incluso empleados de la propia compañía (lo ideal es que sea una mezcla de todos ellos).</p><p>Los problemas del Crowd son, por definición, los spammers.</p><p><a
href="http://javiercasares.net/uploads/2012-04-17-14.51.34.jpg"><img
src="http://javiercasares.net/uploads/2012-04-17-14.51.34-550x328.jpg" alt="" title="2012-04-17 14.51.34" width="550" height="328" class="aligncenter size-large wp-image-3800" /></a></p><p>Además encontramos problemas en cuanto a las especificaciones de las tareas, a las guías de estilo de cómo han de responder. Aunque el problema mayor es la fiabilidad de la inteligencia colectiva, que requiere respuestas fiables y una serie de bases representativa.</p><p>A continuación tenemos <a
href="http://javiercasares.net/uploads/crowdsearch-difallah.pdf"><strong>Mechanical Cheat: Spamming Schemes and Adversarial Techniques on Crowdsourcing Platforms</strong></a> (de <em>Djellel Eddine Difallah</em>, <em>Gianluca Demartini</em> y <em>Philippe Cudré-Mauroux</em>).</p><p>¿Cómo se puede saber si una respuesta generada por los usuarios es spam? Por ejemplo que se haya contestado de forma aleatoria, que se haya generado de forma artificial o que sea duplicada de otra fuente. Para verificar esto es necesario el uso de algoritmos de selección y filtrado. En general las herramientas colaborativas tienen un bajo sistema de control del spam.</p><p>Para acabar, <a
href="http://javiercasares.net/uploads/crowdsearch-brambilla.pdf"><strong>A Model-Driven Approach for Crowdsourcing Search</strong></a> (de <em>Alessandro Bozzon</em>, <a
href="mailto:marco.brambilla@polimi.it"><em>Marco Brambilla</em></a> y <em>Andrea Mauri</em>).</p><p>La idea es cómo sacar información de la gente cuando se realizan búsquedas. En general se hace una búsqueda y se va refinando hasta conseguir la respuesta. pero en algunos casos puede que la respuesta nos e ala óptima. Para esto se puede usar un sistema añadido que se basa en datos anónimos de otros usuarios.</p><p><a
href="http://javiercasares.net/uploads/2012-04-17-15.23.49.jpg"><img
src="http://javiercasares.net/uploads/2012-04-17-15.23.49-550x328.jpg" alt="" title="2012-04-17 15.23.49" width="550" height="328" class="aligncenter size-large wp-image-3801" /></a></p><p>La idea es que, tras extraer datos de distintas API, se permita enviar la consulta a tus amigos de diferentes plataformas sociales (tipo facebook) y demás que, en un tiempo limitado, decidan las respuestas para mejorar la consulta.</p><p><a
href="http://javiercasares.net/uploads/2012-04-17-15.29.21.jpg"><img
src="http://javiercasares.net/uploads/2012-04-17-15.29.21-550x328.jpg" alt="" title="2012-04-17 15.29.21" width="550" height="328" class="aligncenter size-large wp-image-3802" /></a></p>
]]></content:encoded>
<wfw:commentRss>http://javiercasares.com/blog/www2012-crowdsearch-2012-methods-and-tools/feed/</wfw:commentRss>
<slash:comments>0</slash:comments>
</item>
<item><title>#WWW2012: CrowdSearch 2012, crowdsearching on textual and linked data</title><link>http://javiercasares.com/blog/www2012-crowdsearch-2012-textual-linked-data/</link>
<comments>http://javiercasares.com/blog/www2012-crowdsearch-2012-textual-linked-data/#comments</comments>
<pubDate>Tue, 17 Apr 2012 09:04:39 +0000</pubDate>
<dc:creator>Javier Casares</dc:creator>
<category><![CDATA[Eventos]]></category>
<category><![CDATA[Lyon]]></category>
<category><![CDATA[Search Engine Optimization]]></category>
<guid
isPermaLink="false">http://javiercasares.com/?p=3784</guid>
<description><![CDATA[Seguimos con las presentaciones&#8230; ahora empiezan las charlas más formativas y técnicas. Comienza la charla Social-Textual Search and Ranking (de Ali Khodaei y Cyrus Shahabi). En los últimos años las redes sociales se han disparado, y tenemos una serie de &#8230; <a
href="http://javiercasares.com/blog/www2012-crowdsearch-2012-textual-linked-data/">Sigue leyendo <span
class="meta-nav">&#8594;</span></a>]]></description>
<content:encoded><![CDATA[<p>Seguimos con las presentaciones&#8230; ahora empiezan las charlas más formativas y técnicas. Comienza la charla <a
href="http://javiercasares.net/uploads/crowdsearch-khodaei.pdf"><strong>Social-Textual Search and Ranking</strong></a> (de <em>Ali Khodaei</em> y <em>Cyrus Shahabi</em>).</p><p>En los últimos años las redes sociales se han disparado, y tenemos una serie de relaciones como los intereses similares que podemos conseguir gracias a nuestros amigos o a grupos. Todo esto básicamente conseguido gracias a la llamada Web 2.0.</p><p><a
href="http://javiercasares.net/uploads/2012-04-17-11.09.00.jpg"><img
src="http://javiercasares.net/uploads/2012-04-17-11.09.00-550x328.jpg" alt="" title="2012-04-17 11.09.00" width="550" height="328" class="aligncenter size-large wp-image-3793" /></a></p><p>Una pregunta importante a hacernos es &#8220;qué es la relevancia social&#8221;. Cómo podemos relacionarla con la relevancia textual (la que usan los buscadores). Esto también va unido a la relación entre pares de documentos.</p><p>Para todo esto debemos presentar el concepto &#8220;Social-textual Query&#8221;, o sea una consulta textual que implícitamente lleve una parte social. Esta lleva una parte de relevancia textual y una parte de relevancia social (además de las acciones sociales que se pueden realizar).</p><p>Hay 3 grandes factores:</p><ol><li>La relevancia de cada usuario según la búsqueda, es decir, si la temática que tiene este usuario sobre unos temas particulares son relevantes o no lo son.</li><li>La relevancia del usuario en el grupo, en la propia red social, que se podría medir por los seguidores, los que sigues, su importancia&#8230;</li><li>Por último tenemos las acciones del usuario; por ejemplo tener un vídeo en Youtube es más relevante que comentar un vídeo.</li></ol><p><a
href="http://javiercasares.net/uploads/2012-04-17-11.19.19.jpg"><img
src="http://javiercasares.net/uploads/2012-04-17-11.19.19-550x328.jpg" alt="" title="2012-04-17 11.19.19" width="550" height="328" class="aligncenter size-large wp-image-3795" /></a></p><p>El cálculo de los valores y pesos es dinámico, es decir, variará según vaya pasando el tiempo con bastante frecuencia ya que las redes sociales evolucionan.</p><p>Los análisis &#8220;en laboratorio&#8221; dicen que si combinamos los resultados textuales con los sociales los primeros resultados de búsqueda mejorarían ligeramente pero que el resto de resultados mejoraría bastante más, lo que en general daría una calidad mayor a los resultados de búsqueda, eso sí, en determinados tipos de búsqueda y dependiendo de tu red social.</p><p>La siguiente charla es <a
href="http://javiercasares.net/uploads/crowdsearch-simperl.pdf"><strong>A semantically enabled architecture for crowdsourced Linked Data management</strong></a> (de <em>Elena Simperl</em>, <em>Maribel Acosta</em> y <em>Barry Norton</em>).</p><p>El <a
href="http://linkeddata.org/">Linked Data</a> básicamente son nodos relacionados la mayoría por <a
href="http://www.w3.org/TR/xhtml-rdfa-primer/">RDFa</a> y su sistema de consulta es <a
href="http://www.w3.org/TR/rdf-sparql-query/">SPARQL</a>. En general los usuarios no saben buscar de forma concreta, por lo que las consultas de búsqueda, aunque se quieran interpretar son difíciles de calcular. Para ello primero hay que corregir internamente las consultas.</p><p>La idea es la de crear un escenario híbrido en el que se tenga en cuenta las consultas y datos establecidos (con SPARQL) junto a elementos de inteligencia colectiva.</p><p><a
href="http://javiercasares.net/uploads/2012-04-17-11.38.05.jpg"><img
src="http://javiercasares.net/uploads/2012-04-17-11.38.05-550x328.jpg" alt="" title="2012-04-17 11.38.05" width="550" height="328" class="aligncenter size-large wp-image-3796" /></a></p><p>Otro de los objetivos es el análisis de la relación entre DataSets, de forma que se podría mejorar la cantidad y calidad de los contenidos de forma automática.</p><p>La última presentación es <a
href="http://javiercasares.net/uploads/crowdsearch-diaz.pdf"><strong>Exploiting Twitter as a Social Channel for Human Computation</strong></a> (de <a
href="mailto:diaz@l3s.de"><em>Ernesto Diaz-Aviles</em></a> y <em>Ricardo Kawase</em>).</p><p>En general se pueden usar herramientas como Mechanical Turk para encontrar computación humana, pero ¿por qué no utilizar algo del estilo Twitter? Twitter tiene más de 300 millones de usuarios y 200 millones de tweets diarios.</p><p>Para ello lo primero que habría que crear es una especie de framework para poder trabajar con los usuarios de la plataforma.</p><p><a
href="http://javiercasares.net/uploads/2012-04-17-12.00.05.jpg"><img
src="http://javiercasares.net/uploads/2012-04-17-12.00.05-550x328.jpg" alt="" title="2012-04-17 12.00.05" width="550" height="328" class="aligncenter size-large wp-image-3797" /></a></p><p>El sistema de preguntas y respuesta se haría mediante tweets, enviando la pregunta, un identificador y las respuestas, teniendo el usuario que contestar con el identificador y la respuesta seleccionada.</p>
]]></content:encoded>
<wfw:commentRss>http://javiercasares.com/blog/www2012-crowdsearch-2012-textual-linked-data/feed/</wfw:commentRss>
<slash:comments>0</slash:comments>
</item>
<item><title>#WWW2012: CrowdSearch 2012, bienvenida</title><link>http://javiercasares.com/blog/www2012-crowdsearch-2012-bienvenida/</link>
<comments>http://javiercasares.com/blog/www2012-crowdsearch-2012-bienvenida/#comments</comments>
<pubDate>Tue, 17 Apr 2012 07:07:46 +0000</pubDate>
<dc:creator>Javier Casares</dc:creator>
<category><![CDATA[Eventos]]></category>
<category><![CDATA[Lyon]]></category>
<category><![CDATA[Search Engine Optimization]]></category>
<guid
isPermaLink="false">http://javiercasares.com/?p=3782</guid>
<description><![CDATA[Y comienza un nuevo día en Lyon en el evento WWW2012, en este caso con el Workshop CrowdSearch 2012: First International Workshop on Crowdsourcing Web Search . Si ayer los temas iban más enfocados a la calidad de los contenidos, &#8230; <a
href="http://javiercasares.com/blog/www2012-crowdsearch-2012-bienvenida/">Sigue leyendo <span
class="meta-nav">&#8594;</span></a>]]></description>
<content:encoded><![CDATA[<p>Y comienza un nuevo día en Lyon en el evento WWW2012, en este caso con el Workshop <a
href="http://crowdsearch.como.polimi.it/">CrowdSearch 2012: First International Workshop on Crowdsourcing Web Search<br
/>
</a>. Si ayer los temas iban más enfocados a la calidad de los contenidos, a combatir el web-spam y similares, hoy toca el día a los enlaces, a su calidad y, sobre todo, a su socialización dentro de la red de redes.</p><p>Para comenzar <a
href="mailto:Loretta.Anania@ec.europa.eu"><em>Loretta Anania</em></a>, la que era responsable de buscadores de la Unión Europea comienza explicando la importancia sobre los buscadores y sobre la innovación que han llevado a cabo. También presenta un evento llamado <a
href="http://www.search-computing.it/">Search Computing: The Search Computing Project</a> que se llevará a cabo a finales de septiembre. <q>Es un momento de grandes cambios, venimos aquí a tomar ideas</q>.</p><p>La primera de las charlas (en este caso como invitado) será <a
href="http://javiercasares.net/uploads/crowdsearch-kossman.pdf"><strong>Using the Crowd to Solve Database Problems</strong></a> (por <em>Donald Kossman</em>). Va a hablar de un concepto como <em>CrowdDB</em>, que básicamente es la colaboración entre máquinas y humanos en relación a las bases de datos. Podéis decargar el paper <a
href="http://javiercasares.net/uploads/CrowdDB-Answering-Queries-with-Crowdsourcing.pdf">CrowdDB: Answering Queries with Crowdsourcing</a>.</p><p>El sistema de Google es el de tener más datos y para ello añadir más sistemas de proceso. Con esto tenemos búsquedas, traducción&#8230; En cambio, el sistema del resto del mundo es el de usar la inteligencia colectiva. El objetivo es conseguir lo mejor de ambos sistemas. Con esto conseguiremos un sistema más inteligente.</p><p><a
href="http://javiercasares.net/uploads/2012-04-17-09.21.53.jpg"><img
src="http://javiercasares.net/uploads/2012-04-17-09.21.53-550x328.jpg" alt="" title="2012-04-17 09.21.53" width="550" height="328" class="aligncenter size-large wp-image-3789" /></a></p><p>Comenta la idea de <a
href="http://en.wikipedia.org/wiki/J._C._R._Licklider">J. C. R. Licklider</a>, que básicamente hablaba de lo que ha conseguido Google pero hace muchísimos años atrás.</p><p>¿Por qué ahora?, porque se puede usar de forma sistemática y porque existen herramientas que lo permiten, como por ejemplo <a
href="https://www.mturk.com/mturk/welcome">Mechanical Turk</a> u <a
href="https://www.odesk.com/">oDesk</a>. Pero debemos tener en cuenta que no podemos usar a la gente como máquinas.</p><p><a
href="http://javiercasares.net/uploads/2012-04-17-09.29.37.jpg"><img
src="http://javiercasares.net/uploads/2012-04-17-09.29.37-550x328.jpg" alt="" title="2012-04-17 09.29.37" width="550" height="328" class="aligncenter size-large wp-image-3790" /></a></p><p>Pero hay ciertas cosas buenas y cosas malas&#8230; en general las cosas en las que las máquinas son buenas, la gente es mala, y en lo que las máquinas son malas la gente es buena. Por ejemplo a la gente hay que entrenarla, hay temas legales, la posibilidad de uso depende de horarios y otros factores&#8230;</p><p>Las dudas que se generan son cómo se desarrolla un sistema para lo colectivo y, sobre todo, cómo puede ayudar esto a resolver problemas de IT. El objetivo sería hablar SQL con las personas&#8230; las aplicaciones hace consultas SQL hacia unos sistemas&#8230; pero, ¿y si en vez de haber datos almacenados por debajo hay personas que responden? Los problemas para ello son que hoy en día queremos resolver problemas que antes no se querían resolver, y el SQL se queda &#8220;corto&#8221; para ello. Hoy en día hay un problema de resolución de entidades. Por mucho que le hagamos una petición por SQL con el nombre de &#8220;IBM&#8221;, si en la base de datos tenemos &#8220;International Business Machines&#8221;, la respuesta va a ser cero. Otro problema es que no haya datos en la base de datos para responder.</p><p><a
href="http://javiercasares.net/uploads/2012-04-17-09.52.49.jpg"><img
src="http://javiercasares.net/uploads/2012-04-17-09.52.49-550x328.jpg" alt="" title="2012-04-17 09.52.49" width="550" height="328" class="aligncenter size-large wp-image-3791" /></a></p><p>El primer paso para conseguir este tipo de cosas es el de cambiar ligeramente el SQL para hacerlo más comprensible, pero no mucho. Además, hay que decidir qué parte responderá el sistema y qué parte responderá la inteligencia colectiva. La gente puede encontrar datos de una forma rápida y correcta, incluyendo comparaciones sencillas (por ejemplo encontrar un perro en una serie de fotos). En cambio ordenar contenidos, relacionar contenidos de distintas tablas&#8230; en general, todo lo que las máquinas saben hacer bien.</p><p>El CrowdSQL podría ser algo parecido a esto:</p><p><a
href="http://javiercasares.net/uploads/2012-04-17-09.59.04.jpg"><img
src="http://javiercasares.net/uploads/2012-04-17-09.59.04-550x328.jpg" alt="" title="2012-04-17 09.59.04" width="550" height="328" class="aligncenter size-large wp-image-3792" /></a></p><p>Un elemento básico es el almacenamiento de la información resultante de la inteligencia colectiva, algo básico en Google, ya que no hacerlo tiene un coste excesivamente elevado. Al fin y al cabo, si los usuarios te dan la respuesta, cuando otro usuario la consulte, ya la tienes. Pero para esto hay que añadir pesos, ya que la cantidad de veces que la inteligencia colectiva da la misma respuesta a una misma pregunta esa respuesta tiene más peso que cualquier otra respuesta.</p>
]]></content:encoded>
<wfw:commentRss>http://javiercasares.com/blog/www2012-crowdsearch-2012-bienvenida/feed/</wfw:commentRss>
<slash:comments>0</slash:comments>
</item>
<item><title>#WWW2012: WebQuality 2012, Abuse Detection and Prevention Session</title><link>http://javiercasares.com/blog/www2012-webquality-2012-abuse-detection-and-prevention/</link>
<comments>http://javiercasares.com/blog/www2012-webquality-2012-abuse-detection-and-prevention/#comments</comments>
<pubDate>Mon, 16 Apr 2012 11:52:55 +0000</pubDate>
<dc:creator>Javier Casares</dc:creator>
<category><![CDATA[Eventos]]></category>
<category><![CDATA[Lyon]]></category>
<category><![CDATA[Search Engine Optimization]]></category>
<guid
isPermaLink="false">http://javiercasares.com/?p=3757</guid>
<description><![CDATA[Y para acabar el día, tras las presentaciones sobre Web Quality, y las de credibilidad y confianza, ahora le llega el turno a la detección y prevención de abusos (y spam). La primera charla es Detecting Collective Attention Spam (de &#8230; <a
href="http://javiercasares.com/blog/www2012-webquality-2012-abuse-detection-and-prevention/">Sigue leyendo <span
class="meta-nav">&#8594;</span></a>]]></description>
<content:encoded><![CDATA[<p>Y para acabar el día, tras las <a
href="http://javiercasares.com/blog/www2012-webquality-2012-web-quality/">presentaciones sobre Web Quality</a>, y las de <a
href="http://javiercasares.com/blog/www2012-webquality-2012-online-credibility-and-trust/">credibilidad y confianza</a>, ahora le llega el turno a la detección y prevención de abusos (y spam).</p><p>La primera charla es <a
href="http://javiercasares.net/uploads/p48-lee.pdf"><strong>Detecting Collective Attention Spam</strong></a> (de <a
href="mailto:kyumin@cse.tamu.edu"><em>Kyumin Lee</em></a>, <em>James Caverlee</em>, <em>Krishna Kamath</em> y <em>Zhiyuan Cheng</em>).</p><p>Aparecer en la página principal de Youtube, eventos como el Año Nuevo generan marketing viral y atención colectiva, consiguiendo ser &#8220;trend&#8221; (Google Trends o Twitter Trending Topic). En general los spammers van a por momentos de atención que se convierten en fenómenos.</p><p><a
href="http://javiercasares.net/uploads/IMAG0209.jpg"><img
src="http://javiercasares.net/uploads/IMAG0209-550x328.jpg" alt="" title="IMAG0209" width="550" height="328" class="aligncenter size-large wp-image-3775" /></a></p><p>Primero se consigue información de los temas con tendencia y se generan contenidos para twitter, afcebook, youtube, foursquare&#8230; eso genera atención por parte de los usuarios.</p><p><a
href="http://javiercasares.net/uploads/IMAG0210.jpg"><img
src="http://javiercasares.net/uploads/IMAG0210-550x328.jpg" alt="" title="IMAG0210" width="550" height="328" class="aligncenter size-large wp-image-3776" /></a></p><p>En general los spammers en Twitter, a diferencia de lo que se podría suponer en Social media, suelen tener 0 seguidores y siguen a 0 personas, con una media de 9 mensajes. En general, las cuentas de spam suelen tener un pico de mensajes, otro pico al cabo de un mes, y otro pico dos meses después (a los 3 meses). Es interesante un 75% de las cuentas spam son suspendidas por parte de twitter en menos de 24 horas (principalmente en las 6 primeras horas).</p><p>Los scammers suelen usar nombres de famosos para generar spam. Además, se suelen usar redirectores tipo BitLy, a los que añaden parámetros y que son utilizados a lo largo del tiempo cada vez más.</p><p>Un 75% de los mensajes de spam pueden detectarse en las primeras 2 horas según se lanzan los primeros ataques. Los falsos positivos rondan el 2 por mil.</p><p><a
href="http://javiercasares.net/uploads/2012-04-16-14.19.55.jpg"><img
src="http://javiercasares.net/uploads/2012-04-16-14.19.55-550x328.jpg" alt="" title="2012-04-16 14.19.55" width="550" height="328" class="aligncenter size-large wp-image-3777" /></a></p><p>Lo que se analiza es todos los conceptos que entran como Trending Topic como sistema de muestreo. En resumen se puede detectar los mensajes de spam al poco tiempo con una alta detección (cerca del 99% en 3 horas).</p><p><a
href="http://javiercasares.net/uploads/2012-04-16-14.28.48.jpg"><img
src="http://javiercasares.net/uploads/2012-04-16-14.28.48-550x328.jpg" alt="" title="2012-04-16 14.28.48" width="550" height="328" class="aligncenter size-large wp-image-3778" /></a></p><p>Las siguientes charla es <a
href="http://javiercasares.net/uploads/p56-chandy.pdf"><strong>Identifying Spam in the iOS App Store</strong></a> (de <em>Rishi Chandy</em> y <em>Haijie Gu</em>) en la que se analiza cómo detectar spam en las aplicaciones de la Apple Store.</p><p>Entre 2008 y 2012 se han añadido más de medio millón de aplicaciones a la App Store. Las grandes aplicaciones tienen un problema, ye s que no se sabe bien cómo gestionan los datos privados. Por ejemplo <a
href="http://techcrunch.com/2012/02/07/path-uploads-your-iphones-address-book-to-their-servers-without-a-peep/">el caso Path</a>.</p><p>Algunos spammers (desarrollaodres) pagan a usuarios para que hagan reseñas positivas en la App Store.</p><p><a
href="http://javiercasares.net/uploads/2012-04-16-14.36.23.jpg"><img
src="http://javiercasares.net/uploads/2012-04-16-14.36.23-550x328.jpg" alt="" title="2012-04-16 14.36.23" width="550" height="328" class="aligncenter size-large wp-image-3779" /></a></p><p>Por ahora lo que se analiza es el valor de las reseñas, la cantidad de las reseñas, cuántas reseñas tienen cada usuario y sus valores y cuántas reseñas tiene el desarrollador y sus valores.</p><p>La última presentación es <a
href="http://javiercasares.net/uploads/p60-le.pdf"><strong>kaPoW Plugins: Protecting Web Applications Using Reputation-based Proof-of-Work</strong></a> (de <em>Akshay Dua</em>, <em>Wu-Chang Feng</em> y <em>Tien Le</em>).</p><p>El spam funciona. En twitter, por ejemplo, funciona el doble mejor que en el caso del correo, si los comparamos. Uno de los sistemas que se usan para parar el spam son los captchas, pero cada vez tienen más problemas ya que son más sencillos de hackear. También existen los filtros antispam, pero tienen falsos positivos. Otro elemento es la opción de reporting del usuario (como por ejemplo hace Twitter) aunque puede llegar tarde.</p><p><a
href="http://javiercasares.net/uploads/2012-04-16-14.55.19.jpg"><img
src="http://javiercasares.net/uploads/2012-04-16-14.55.19-550x328.jpg" alt="" title="2012-04-16 14.55.19" width="550" height="328" class="aligncenter size-large wp-image-3780" /></a></p><p>Una opción para mejorar este sistema podría ser el imponer un coste por cada mensaje. Una opción podría ser la de jugar con puzzles. Esto reduciría la velocidad del spam. Por ejemplo a los usuarios nuevos se les pueden poner puzzles más complejos y a los que llevan tiempo cada vez más sencillos para mejorar la velocidad.</p><p>Esto se podría organizar con un sistema de plugins, por ejemplo para WordPress o phpBB. Los usuarios tendrían una puntuación que permite que la dificultad del puzzle sea mayor o menos.</p><p><a
href="http://javiercasares.net/uploads/2012-04-16-14.57.58.jpg"><img
src="http://javiercasares.net/uploads/2012-04-16-14.57.58-550x328.jpg" alt="" title="2012-04-16 14.57.58" width="550" height="328" class="aligncenter size-large wp-image-3781" /></a></p><p>En el correo sería algo más complejo de aplicar. Además, los puzzles tienen una limitación de tiempo. Lo primero que se ha de establecer es la dificultad del puzzle. La dificultad se basa en la reputación. Esto vendría de una mezcla de pesos entre puntuaciones locales y globales, por ejemplo, si la IP está en listas negras, si la cuenta es nueva o no&#8230;</p><p>Se puede ver más información sobre este sistema en <a
href="http://kapow.cs.pdx.edu/kapow/">kaPoW: Web-based Client Puzzles</a>.</p>
]]></content:encoded>
<wfw:commentRss>http://javiercasares.com/blog/www2012-webquality-2012-abuse-detection-and-prevention/feed/</wfw:commentRss>
<slash:comments>0</slash:comments>
</item>
<item><title>#WWW2012: WebQuality 2012, Online Credibility and Trust Session</title><link>http://javiercasares.com/blog/www2012-webquality-2012-online-credibility-and-trust/</link>
<comments>http://javiercasares.com/blog/www2012-webquality-2012-online-credibility-and-trust/#comments</comments>
<pubDate>Mon, 16 Apr 2012 08:23:27 +0000</pubDate>
<dc:creator>Javier Casares</dc:creator>
<category><![CDATA[Eventos]]></category>
<category><![CDATA[Lyon]]></category>
<category><![CDATA[Search Engine Optimization]]></category>
<guid
isPermaLink="false">http://javiercasares.com/?p=3756</guid>
<description><![CDATA[Y tras las presentaciones sobre Web Quality, ahora tocan las de credibilidad y confianza. La primera charla es Game-theoretic Models of Web Credibility (de Thanasis Papaioannou, Katarzyna Abramczuk, Paulina Adamska, Adam Wierzbicki y Karl Aberer). Uno de los mayores problemas &#8230; <a
href="http://javiercasares.com/blog/www2012-webquality-2012-online-credibility-and-trust/">Sigue leyendo <span
class="meta-nav">&#8594;</span></a>]]></description>
<content:encoded><![CDATA[<p>Y tras las <a
href="http://javiercasares.com/blog/www2012-webquality-2012-web-quality/">presentaciones sobre Web Quality</a>, ahora tocan las de credibilidad y confianza.</p><p>La primera charla es <a
href="http://javiercasares.net/uploads/p27-papaioannou.pdf"><strong>Game-theoretic Models of Web Credibility</strong></a> (de <em>Thanasis Papaioannou</em>, <em>Katarzyna Abramczuk</em>, <em>Paulina Adamska</em>, <em>Adam Wierzbicki</em> y <em>Karl Aberer</em>).</p><p>Uno de los mayores problemas hoy en día es la creciente dificultad de detectar la credibilidad de los contenidos en Internet. Puede haber factores económicos que pueden incluir en la calidad o neutralidad, por ejemplo. Los primeros acercamientos hacen referencia a estudios empíricos, a mecanismos de repitación /pero hay que tener en cuenta la información histórica, que es muy relevante) y, lo que se nos propone, que es un juego entre los contenidos producidos y los consumidos.</p><p>A la hora de tener elementos en cuenta debemos distinguir entre el contenido producido por los generadores y por los consumidores. Además hay que distinguir la calidad y presentación del mismo y finalmente la experiencia de los usuarios, además del incentivo económica. En el caso de los lectores de los contenidos hay que tener en cuenta dos opciones, que acepten o que rechacen dicho contenido.</p><p>Los generadores de contenidos han de ir a buscar la honestidad hacia los buenos contenidos y decidir entre la inversión o no en la presentación de dichos contenidos.</p><p><a
href="http://javiercasares.net/uploads/IMAG0188.jpg"><img
src="http://javiercasares.net/uploads/IMAG0188-550x328.jpg" alt="" title="IMAG0188" width="550" height="328" class="aligncenter size-large wp-image-3760" /></a></p><p>Hay que tener también en cuenta los usuarios&#8230; hay una gran diferencia entre los usuarios ingenuos y los expertos. Los usuarios ingenuos necesitas una gran inversión en diseño y en la presentación de los contenidos, en cambio los usuarios expertos dejan un poco de lado esto, ya que se centran más en el contenido propiamente. Los usuarios ingenuos siempre rechazan una mala apariencia y aceptan una buena apariencia.</p><p><a
href="http://javiercasares.net/uploads/IMAG0192.jpg"><img
src="http://javiercasares.net/uploads/IMAG0192-550x328.jpg" alt="" title="IMAG0192" width="550" height="328" class="aligncenter size-large wp-image-3761" /></a></p><p>La siguiente presentación es <a
href="http://javiercasares.net/uploads/p35-lin.pdf"><strong>An Information Theoretic Approach to Sentimental Polarity Classification</strong></a> (de <a
href="mailto:ymlinbh@gmail.com"><em>Yuming Lin</em></a>, <em>Jingwei Zhang</em>, <em>Wang Xiaoling</em> y <em>Aoying Zhou</em>).</p><p>En la red hay muchos temas, que provocan efectos sentimentales que pueden ser positivos o negativos. En base a esto podemos hacer una clasificación. Esta información la podemos extraer de elementos que marquen detalles positivos o negativos (me gusta, no me gusta). Para ello hay que sacar y analizar frases y no palabras sueltas. Una de las formas para establecer la tendencia es la cantidad de veces que aparecen dichos elementos en el documento.</p><p><a
href="http://javiercasares.net/uploads/IMAG0195.jpg"><img
src="http://javiercasares.net/uploads/IMAG0195-550x328.jpg" alt="" title="IMAG0195" width="550" height="328" class="aligncenter size-large wp-image-3762" /></a></p><p>Un ejemplo de DataSet para realizar un experimento lo podemos encontrar en <a
href="http://www.cs.jhu.edu/~mdredze/datasets/sentiment/">Multi-Domain Sentiment Dataset</a>.</p><p>La última charla es <a
href="http://javiercasares.net/uploads/p41-siklosi.pdf"><strong>Content-Based Trust and Bias Classification via Biclustering</strong></a> (de <em>David Siklosi</em>, <em>Balint Daroczy</em> y <em>Andras A. Benczur</em>).</p><p>La idea es la de encontrar a las instituciones a seleccionar los contenidos fiables de la red de redes. Esto también ayuda a detección del spam y a clasificar la escalabilidad según el tamaño de la Web. En este caso se han seleccionado 3 categorías para diferenciar los contenidos: credibilidad, neutralidad y parcialidad.</p><p>El biclustering es un sistema de clustering bidireccional, que analiza sitios web y los términos que incluyen los mismos. Gracias a esto se pueden encontrar sitios similares con contenidos similares y analizarlos en la misma situación y calidad. Además, con este sistema también podemos extraer dominios relacionados con temáticas relacionadas, de forma que se puedan categorizar de forma sencilla.</p><p><a
href="http://javiercasares.net/uploads/IMAG0205.jpg"><img
src="http://javiercasares.net/uploads/IMAG0205-550x328.jpg" alt="" title="IMAG0205" width="550" height="328" class="aligncenter size-large wp-image-3763" /></a></p>
]]></content:encoded>
<wfw:commentRss>http://javiercasares.com/blog/www2012-webquality-2012-online-credibility-and-trust/feed/</wfw:commentRss>
<slash:comments>1</slash:comments>
</item>
<item><title>#WWW2012: WebQuality 2012, Web Quality Session</title><link>http://javiercasares.com/blog/www2012-webquality-2012-web-quality/</link>
<comments>http://javiercasares.com/blog/www2012-webquality-2012-web-quality/#comments</comments>
<pubDate>Mon, 16 Apr 2012 07:06:27 +0000</pubDate>
<dc:creator>Javier Casares</dc:creator>
<category><![CDATA[Eventos]]></category>
<category><![CDATA[Lyon]]></category>
<category><![CDATA[Search Engine Optimization]]></category>
<guid
isPermaLink="false">http://javiercasares.com/?p=3739</guid>
<description><![CDATA[Y como lo prometido es deuda, comienzo con las charlas de hoy, concretamente las del WebQuality 2012. Comenzamos con un cambio en el programa, así que toca A Breakdown of Quality Flaws in Wikipedia (Maik Anderka y Benno Stein). La &#8230; <a
href="http://javiercasares.com/blog/www2012-webquality-2012-web-quality/">Sigue leyendo <span
class="meta-nav">&#8594;</span></a>]]></description>
<content:encoded><![CDATA[<p>Y como lo prometido es deuda, comienzo con las charlas de hoy, concretamente las del <a
href="http://www.dl.kuis.kyoto-u.ac.jp/webquality2012/">WebQuality 2012</a>.</p><p>Comenzamos con un cambio en el programa, así que toca <a
href="http://javiercasares.net/uploads/p11-anderka.pdf"><strong>A Breakdown of Quality Flaws in Wikipedia</strong></a> (<a
href="mailto:maik.anderka@uni-weimar.de"><em>Maik Anderka</em></a> y <em>Benno Stein</em>). La idea es investigar la calidad de la Wikipedia, ya que es muy grande: tiene cerca de 90 millones de páginas, 22 millones de artículos y es la sexta web más visitada del mundo.</p><p><a
href="http://javiercasares.net/uploads/IMAG0150.jpg"><img
src="http://javiercasares.net/uploads/IMAG0150-550x328.jpg" alt="" title="IMAG0150" width="550" height="328" class="aligncenter size-large wp-image-3741" /></a></p><p>Para la calidad hay algunos elementos como que cualquiera puede editarla, los autores son muy distintos y las ediciones nos e revisan antes de la publicación. Esto implica que las mejoras sean de baja calidad y que sea difícil mantener la alta calidad.</p><p>Sólo un 0,1% de los artículos de la Wikipedia en inglés son destacados&#8230; ¿qué ocurre con el otro 99,99%? Cualquiera puede marcar artículos como incompletos o completos. La idea es intentar hacer un sistema que revise las diferentes plantillas y genere un sistema de organización automático.</p><p><a
href="http://javiercasares.net/uploads/IMAG0151.jpg"><img
src="http://javiercasares.net/uploads/IMAG0151-550x328.jpg" alt="" title="IMAG0151" width="550" height="328" class="aligncenter size-large wp-image-3742" /></a></p><p>La reorganización se hace en base a dos tipos de limpieza: la primera es la de la reorganización por tipo, de las cuales el sistema principal es la <em>verificabilidad</em>.</p><p><a
href="http://javiercasares.net/uploads/IMAG0152.jpg"><img
src="http://javiercasares.net/uploads/IMAG0152-550x328.jpg" alt="" title="IMAG0152" width="550" height="328" class="aligncenter size-large wp-image-3743" /></a></p><p>La segunda revisión hace referencia al alcance de los contenidos, en concreto, a los defectos que tienen. En general los problemas (la mayoría) se encuentra en los artículos enciclopédicos (vamos, las páginas de consulta) aunque se pueden encontrar también muchos errores en los ficheros o incluso en las propias plantillas que se usan para los artículos.</p><p>¿Qué tipo de artículos son los que más defectos tendrían? La mitad de los artículos sobre informática contienen defectos, seguidos de los referentes a las creencias. Una cuarta parte de los que hacen referencia a cronología, matemáticas y un 20% de geografía contienen algún tipo de defecto.</p><p>¿Cuáles son los tipos de defectos más habituales? Un 20% hacen referencia a la verifiabilidad.</p><p><a
href="http://javiercasares.net/uploads/IMAG0156.jpg"><img
src="http://javiercasares.net/uploads/IMAG0156-550x328.jpg" alt="" title="IMAG0156" width="550" height="328" class="aligncenter size-large wp-image-3744" /></a></p><p>Si se organiza de forma correcta y nos basamos en artículos ya verificados, se podría llegar a detectar un 40% de artículos que tienen algún tipo de defecto hasta corregirlos. Se está organizando una <a
href="http://pan.webis.de/">competición para detectar la previsión de errores en la Wikipedia</a>.</p><p>Se ha llevado a cabo un trabajo sobre la corrección. Un 25% de los artículos se han corregido, de los cuales un 70% tienen problemas de verificabilidad.</p><p>La siguiente presentación es <a
href="http://javiercasares.net/uploads/p1-baeza-yates.pdf"><strong>On Measuring the Lexical Quality of the Web</strong></a> (por <em>Ricardo Baeza-Yates</em> y <em>Luz Rello</em>).</p><p>Medir la calidad de una página web es el mayor problema de los motores de búsqueda hoy en día, o sea, cómo rankear las páginas. Todo depende de la calidad semántica intrínseca. Para comenzar se analiza la cantidad de palabras que se usan en &#8220;el mundo real&#8221; y luego su relación con su uso en la red de redes, aunque después se han propuesto también la integración de errores tipográficos y semánticos.</p><p><a
href="http://javiercasares.net/uploads/IMAG0160.jpg"><img
src="http://javiercasares.net/uploads/IMAG0160-550x328.jpg" alt="" title="IMAG0160" width="550" height="328" class="aligncenter size-large wp-image-3746" /></a></p><p><a
href="http://javiercasares.net/uploads/IMAG0161.jpg"><img
src="http://javiercasares.net/uploads/IMAG0161-550x328.jpg" alt="" title="IMAG0161" width="550" height="328" class="aligncenter size-large wp-image-3747" /></a></p><p>Para medir la calidad del léxico debe ser independiente del tamaño del texto o de las páginas de un sitio y compararlo con cualquier otro tipo de documento y/o tamaño.</p><p><a
href="http://javiercasares.net/uploads/IMAG0162.jpg"><img
src="http://javiercasares.net/uploads/IMAG0162-550x328.jpg" alt="" title="IMAG0162" width="550" height="328" class="aligncenter size-large wp-image-3748" /></a></p><p>La calidad léxica depende de la relación de las palabras con faltas de ortografía y la palabra escrita correctamente. De esta forma se saca un ratio general de cómo escribe la gente. Hay varias condiciones: frecuencia, el ratio más alto de faltas de ortografía y la desambiguación (nombres, acrónimos, palabras en otros idiomas&#8230;)</p><p>Algunas de las palabras con más errores de ortografía son las siguientes:</p><p><a
href="http://javiercasares.net/uploads/IMAG0164.jpg"><img
src="http://javiercasares.net/uploads/IMAG0164-550x328.jpg" alt="" title="IMAG0164" width="550" height="328" class="aligncenter size-large wp-image-3749" /></a></p><p>Es curioso porque los ratios no se pueden comparar entre idiomas, ya que las curvas entre cantidades de palabras pueden variar significativamente.</p><p>La calidad del idioma inglés según Google en marzo de 2011 es de 0,047, en el caso de Yahoo! es de 0,099. Usando una colección web de 28.000 documentos se puede alcanzar una cifra de 0,037. Además, si comparamos Google y Bing con el paso del tiempo (2011 vs. 2012) podemos comprobar que la calidad léxica va empeorando (en los análisis aparece que Bing tiene el doble de peor calidad léxica que Google). Como detalle, los contenidos de la CNN son bastante malos, principalmente por los comentarios (un 50% de baja calidad léxica). En el caso de dominios .EDU o .AC.UK pasa todo lo contrario. Incluso, la Wikipedia o la ODP tienen un ratio de mejor calidad que los sitios académicos.</p><p><a
href="http://javiercasares.net/uploads/IMAG0169.jpg"><img
src="http://javiercasares.net/uploads/IMAG0169-550x328.jpg" alt="" title="IMAG0169" width="550" height="328" class="aligncenter size-large wp-image-3750" /></a></p><p>En el caso del español la calidad es bastante mejor que la inglesa. Aunque en el caso de las redes sociales la calidad está por debajo de la media. Un sitio que tiene una gran calidad léxica es Flickr, aunque tiene poco contenido textual.</p><p><a
href="http://javiercasares.net/uploads/IMAG0172.jpg"><img
src="http://javiercasares.net/uploads/IMAG0172-550x328.jpg" alt="" title="IMAG0172" width="550" height="328" class="aligncenter size-large wp-image-3751" /></a></p><p><a
href="http://javiercasares.net/uploads/IMAG0174.jpg"><img
src="http://javiercasares.net/uploads/IMAG0174-550x328.jpg" alt="" title="IMAG0174" width="550" height="328" class="aligncenter size-large wp-image-3752" /></a></p><p>Cuanto más acceso a Internet existe, más posibilidades de baja calidad, ya que el acceso a la red llega a todo tipo de niveles culturales y eso empeora la calidad. España está en una calidad media en estos momentos, al igual que Estados Unidos. Es decir, el nivel cultural y la cantidad de conexiones a Internet influyen en la calidad de los contenidos.</p><p>La relación, en general, de la calidad de los contenidos y los contenidos de un mismo sitio web es alta. También es básico analizar la calidad léxica de la red cada poco tiempo ya que es bastante cambiante.</p><p>La siguiente charla es <a
href="http://javiercasares.net/uploads/p7-lex.pdf"><strong>Measuring the Quality of Web Content using Factual Information</strong></a> (de <a
href="mailto:elex@know-center.at"><em>Elisabeth Lex</em></a>, <em>Michael Voelske</em>, <em>Marcelo Errecalde</em>, <em>Edgardo Ferretti</em>, <em>Leticia Cagnina</em>, <em>Christopher Horn</em>, <em>Benno Stein</em> y <em>Michael Granitzerg</em>).</p><p>Hay que intentar tener presentes algunos puntos: sacar estadísticas simples de hechos de un texto, sacar información relacional de los hechos y buscar relaciones semánticas. Una primera aproximación es mirar las funcionalidades estadísticas del documento, cuñan informativo y qué cantidad de datos abiertos dispone.</p><p>Un detalle es que los documentos largos suelen contener mayor cantidad de hechos, y que hay que comparar documentos de una misma longitud y de distintas longitudes para extraer información, algo que en principio no es muy importante. En el caso de sacar cantidad de hechos en documentos de una misma cantidad de palabras sí que influye, ya que la aproximación es más exacta.</p><p>La última presentación es <a
href="http://javiercasares.net/uploads/p19-kitayama.pdf"><strong>A Deformation Analysis Method for Artificial Maps Based on Geographical Accuracy and Its Applications</strong></a> (de <em>Dasiuke Kitayama</em> y <em>Kazutoshi Sumiya</em>). En este caso se analiza la información y fiabilidad de los mapas.</p><p>En general los mapas tienen muchas deformaciones (ejemplo claro es el de los mapas del metro) tanto en distancias como en formas, ya que no cuadran geográficamente casi ningún dato. El objetivo de este trabajo es el de extraer la información de un mapa &#8220;falso&#8221; (poco preciso) relacionarlo con un mapa real (por ejemplo un Google Maps) e intentar trasladar las coordenadas para sacar una idea correcta y precisa.</p><p>Para ello se pueden sacar informaciones por OCR (como nombres de estaciones o lugares), de ahí se sacan los datos geográficos, se busca el lugar más preciso para situarlos y finalmente se buscan lugares situados incorrectamente.</p><p><a
href="http://javiercasares.net/uploads/IMAG0181.jpg"><img
src="http://javiercasares.net/uploads/IMAG0181-550x328.jpg" alt="" title="IMAG0181" width="550" height="328" class="aligncenter size-large wp-image-3753" /></a></p><p><a
href="http://javiercasares.net/uploads/IMAG0182.jpg"><img
src="http://javiercasares.net/uploads/IMAG0182-550x328.jpg" alt="" title="IMAG0182" width="550" height="328" class="aligncenter size-large wp-image-3754" /></a></p><p><a
href="http://javiercasares.net/uploads/IMAG0183.jpg"><img
src="http://javiercasares.net/uploads/IMAG0183-550x328.jpg" alt="" title="IMAG0183" width="550" height="328" class="aligncenter size-large wp-image-3755" /></a></p><p>Una vez se han situado los puntos, se saca una triangulación para ver el desvío de los mapas. Para analizar el sistema, se ha hecho un proceso automático y luego uno manual que analiza (por personas) si la información situada en los mapas es correcta. Uno de los problemas mayores es la lectura de los lugares del mapa, del que sólo se pueden sacar un 61% de los datos).</p><p>En cuanto a la traslación de los lugares a puntos correctos del mapa, la información tiene una precisión del 62%, eso sí, cuando la traslación de datos es correcta, los mapas quedan con muy buenos resultados.</p><p>En un futuro, uno de los trabajos a realizar es interpretar líneas tratadas como carreteras o ríos para aumentar la credibilidad y precisión.</p>
]]></content:encoded>
<wfw:commentRss>http://javiercasares.com/blog/www2012-webquality-2012-web-quality/feed/</wfw:commentRss>
<slash:comments>3</slash:comments>
</item>
<item><title>#WWW2012: Lyon World Web capital</title><link>http://javiercasares.com/blog/www2012-lyon-world-web-capital/</link>
<comments>http://javiercasares.com/blog/www2012-lyon-world-web-capital/#comments</comments>
<pubDate>Sun, 15 Apr 2012 13:52:31 +0000</pubDate>
<dc:creator>Javier Casares</dc:creator>
<category><![CDATA[Eventos]]></category>
<guid
isPermaLink="false">http://javiercasares.com/?p=3736</guid>
<description><![CDATA[Esta semana es la semana de Lyon (Francia) ya que, entre otras cosas, se celebra la 21ª edición de la International World Wide Web Conference, en este caso la WWW2012 en el Cité Centre de Congrès de Lyon. Y aquí &#8230; <a
href="http://javiercasares.com/blog/www2012-lyon-world-web-capital/">Sigue leyendo <span
class="meta-nav">&#8594;</span></a>]]></description>
<content:encoded><![CDATA[<p>Esta semana es la semana de Lyon (Francia) ya que, entre otras cosas, se celebra la <a
href="http://www2012.wwwconference.org/">21ª edición de la International World Wide Web Conference</a>, en este caso la <strong>WWW2012</strong> en el <a
href="http://www.ccc-lyon.com/">Cité Centre de Congrès de Lyon</a>.</p><p>Y aquí estoy ya, en Lyon, sin saber una pizca de francés fuera del &#8220;wí&#8221;. Y es que, por lo que estoy viendo, a diferencia de París donde estuve hace unas semanas, aquí es mucho más complejo encontrar a alguien que hable inglés. Incluso me ha sorprendido que en los restaurantes que hay en el recinto del Centro de Convenciones los camareros y compañía ni siquiera hagan el esfuerzo de hablarlo&#8230; está visto que estos días voy a pasar hambre.</p><p>Y por si alguien se pregunta que qué hago aquí más concretamente, vengo a dos <em>workshops</em> que se hacen lunes y martes. En concreto he venido a <a
href="http://www.dl.kuis.kyoto-u.ac.jp/webquality2012/">WebQuality 2012</a> y al <a
href="http://crowdsearch.como.polimi.it/">CrowdSearch 2012</a>.</p><p>El primero de ellos, el <strong>WebQuality 2012</strong> (<em>The Anti-Social Web: Credibility and Quality Issues on the Web and Social Media</em>) lo organiza Carlos Castillo (de Yahoo! Research), al que conozco desde hace tiempo ya que ha colaborado en los <a
href="http://www.ojobuscador.com/">Congresos OJObuscador</a>, además de haber asistido yo a algún que otro evento en el que él también participaba hace años. Además, entre los que supervisan este workshop se encuentra Matt Cutts (de Google), al que muchos de los que me seguís también conoceréis y entre los ponentes está Ricardo Baeza (de Yahoo! Research), otro de los grandes que ha participado en los congresos de OJObuscador y al que, personalmente, le tengo un respeto mayúsculo.</p><p>Básicamente de lo que se hablará es del análisis de contenidos, de cómo se mide la calidad del mismo, de identificar la reputación de los autores, del rol que juegan las comunidades, de la credibilidad del contenido multimedia, de reducir el web-spam, detectar abusos de publicidad, medidas contra el plagio&#8230; en fin, como veis es, en el fondo, la respuesta a &#8220;hacia dónde van los buscadores&#8221;.</p><p>El segundo de los workshops <strong>CrowdSearch 2012</strong> (<em>First International Workshop on Crowdsourcing Web Search</em>) me atrajo por eso de la búsqueda &#8220;en grupo&#8221;. La verdad es que no sé cómo traducir <em>Crowdsourcing Web Search</em>, pero vamos, que la idea es que, como ya he comentado muchas veces, los enlaces hoy en día ya no son lo que eran y hay que darles muchos valores más, entre ellos el factor social. Este workshop lo organizan Ricardo Baeza (de Yahoo! Research) y Stefano Ceri (Politecnico di Milano) entre otros. Entre los avales se encuentra Stefano Mazzocchi, actualmente trabajando en Google pero en la parte de <a
href="http://www.freebase.com/">Freebase</a>, de lo que <a
href="http://www.ojobuscador.com/noticias/fows09-freebase-socially-managed-identity-database/">en 2009 ya estaba hablando</a>.</p><p>En este caso algunos de los temas que se van a tratar son los de la calidad de los contenidos basados en las comunidades, trabajo de extracción de datos basados en modelos grupales, herramientas para gestionar contenidos basados en redes sociales, técnicas para mitigar el spam de los elementos sociales&#8230; en resumen, cómo afectan cosas como Twitter, Facebook y similares (donde se concentra un gran número de &#8220;seres humanos&#8221;) a los contenidos.</p><p>En general me gustan este tipo de charlas porque los que las dan son profesores o estudiantes avanzados de universidades de todo el mundo, aquellos que al final son los que proponen los sistemas para que, una vez aprobados y retocados, se implanten en los buscadores poco tiempo después. Hace unos años (en 2008, 2009 y 2010) pude asistir a los FOWS que organizaba Yahoo! Research en donde entre otras cosas conocí todo el tema de los &#8220;microformatos&#8221;, o &#8220;microdatos&#8221;, cosas como Freebase y &#8220;cacharros&#8221; como <a
href="http://sindice.com/">Síndice</a>.</p><p>Así que nada&#8230; mañana, si el tiempo acompaña y hay buena cobertura wifi (y un enchufe cerca) intentaré ir publicando y haciendo seguimiento del workshop.</p>
]]></content:encoded>
<wfw:commentRss>http://javiercasares.com/blog/www2012-lyon-world-web-capital/feed/</wfw:commentRss>
<slash:comments>1</slash:comments>
</item>
<item><title>II Jornada Internet i Empresa</title><link>http://javiercasares.com/blog/ii-jornada-internet-i-empresa/</link>
<comments>http://javiercasares.com/blog/ii-jornada-internet-i-empresa/#comments</comments>
<pubDate>Fri, 13 Apr 2012 14:28:43 +0000</pubDate>
<dc:creator>Javier Casares</dc:creator>
<category><![CDATA[Eventos]]></category>
<category><![CDATA[Search Engine Optimization]]></category>
<guid
isPermaLink="false">http://javiercasares.com/?p=3732</guid>
<description><![CDATA[Hoy estoy en Tortosa (Tarragona) en las charlas que la Cambra de Comerç de Tortosa organiza junto a Empatica en las charlas de Internet i Empresa. Me ha tocado estar en la parte de las charlas de SEO, dando una &#8230; <a
href="http://javiercasares.com/blog/ii-jornada-internet-i-empresa/">Sigue leyendo <span
class="meta-nav">&#8594;</span></a>]]></description>
<content:encoded><![CDATA[<p>Hoy estoy en Tortosa (Tarragona) en las charlas que la <a
href="http://www.cambratortosa.com/">Cambra de Comerç de Tortosa</a> organiza junto a <a
href="http://empatica.net/">Empatica</a> en las charlas de <a
href="http://www.internetiempresa.com/">Internet i Empresa</a>. Me ha tocado estar en la parte de las charlas de SEO, dando una breve charla de poco menos de una hora en la que he explicado un poco todo a nivel introductorio, Buenas Prácticas y cómo evitar penalizaciones.</p><p>Tal y como he prometido a los asistentes a la charla, os dejo <a
href="http://javiercasares.net/uploads/SEO-internetiempresa.pdf">la presentación que he hecho</a> para descargar.</p><p>Agradecer a la organización y a los asistentes sus caras de no entender nada (cosas que pasan), las preguntas (muy interesantes), la conversación a la hora de comer y las discusiones tan interesantes que se han generado.</p><p>Por cierto, brutal la estrategia de Internet de MUNICH, tanto en <a
href="http://www.munichshop.net/">la tienda</a> como en <a
href="http://www.munichclub.com/">el club</a> y <a
href="https://www.facebook.com/MUNICHSports">el Facebook</a>.</p>
]]></content:encoded>
<wfw:commentRss>http://javiercasares.com/blog/ii-jornada-internet-i-empresa/feed/</wfw:commentRss>
<slash:comments>9</slash:comments>
</item>
<item><title>Varnish para WordPress como Servicio</title><link>http://javiercasares.com/blog/varnish-for-wordpress-as-a-service/</link>
<comments>http://javiercasares.com/blog/varnish-for-wordpress-as-a-service/#comments</comments>
<pubDate>Sat, 24 Mar 2012 12:38:52 +0000</pubDate>
<dc:creator>Javier Casares</dc:creator>
<category><![CDATA[Keep IT Simple Lab]]></category>
<category><![CDATA[Varnish]]></category>
<category><![CDATA[Web Performance Optimization]]></category>
<category><![CDATA[WordPress]]></category>
<guid
isPermaLink="false">http://javiercasares.com/?p=3717</guid>
<description><![CDATA[¿Tu WordPress va lento? ¿Te gustaría que volase? Pues esta es la idea que he estado planteando desde hace unos días&#8230; Hace cosa de un año que comencé a montar blogs con WordPress bajo Varnish. Al principio iba bien pero &#8230; <a
href="http://javiercasares.com/blog/varnish-for-wordpress-as-a-service/">Sigue leyendo <span
class="meta-nav">&#8594;</span></a>]]></description>
<content:encoded><![CDATA[<p>¿Tu WordPress va lento? ¿Te gustaría que volase? Pues esta es la idea que he estado planteando desde hace unos días&#8230; Hace cosa de un año que comencé a montar blogs con WordPress bajo Varnish. Al principio iba bien pero configurarlo y mantener las máquinas es algo complejo, a parte de que no todo el mundo puede permitirse montar y mantenerlo. Así que, tras muchas vueltas, pruebas, testeo de plugins y demás, he conseguido poder montar un sistema que, de forma sencilla, permita cachear y mantener un WordPress con Varnish.</p><p>El sistema es sencillo&#8230; sólo hay que subir 2 plugins: uno de ellos es para purgar (limpiar) la caché de Varnish cuando alguien publica algo, comenta, edita&#8230; así, cuando el blog cambie, se regenera la caché y los usuarios ven las cosas nuevas y actualizadas; el otro plugin es algo más genérico y hace referencia a la gestión de la IP, ya que al ser un web-proxy siempre devuelve la misma IP y eso genera problemas con el spam y similares.</p><p>Una vez configurado esto, lo bueno es que se puede probar antes de ponerlo en producción. Simplemente te cambias la IP de tu fichero de <em>host</em> y compruebas si todo funciona correctamente. Una vez probado, se cambian las DNS del dominio y ya está, todo listo.</p><p>Una cosa buena también que tiene este sistema es que, si por lo que sea, el Varnish empezase a hacer e tonto o quieres dejar de usar el servicio, vuelves a poner tus DNS como antes, quitas los plugins y ya está, todo vuelve a la normalidad.</p><p>¿Te gustaría probarlo? Pues <a
href="mailto:javier.casares@kisslab.com">si te interesa puedes escribirme</a> (si me adelantas el dominio en que lo quieres probar, mejor que mejor) y te escribo con todos los pasos. Por ahora vamos a dar una semana de pruebas a aquellos que lo quieras testear en su sitio (ya sea por fichero de <em>host</em> o en producción) y a partir de ahí valdrá 120 euros/año u 80 euros/semestre.</p><p>¿Qué cosas buenas tiene usar este sistema? Primero que tu sitio estará cacheado y que soportará picos de tráfico sin problema; que cuando un robots de búsqueda te visite verá que la web va rápida y te indexará más rápido; por norma general el tráfico SEO aumenta a las 4 semanas de usar este sistema&#8230; además, sigues teniendo el control de todo en todo momento.</p><div
id="pruebas"></div><p>Y para muestra, un par de pruebas&#8230; Las he realizado desde el sitio <a
href="http://www.webpagetest.org/">Web Page test</a>, primero apuntando a la IP del servidor directamente y luego apuntando a la del servidor con Varnish. El sitio desde el que se han hecho las pruebas es París con conexión de Cable.</p><p>Enlaces a los resultados de la <a
href="http://www.webpagetest.org/result/120324_0J_3PYNN/">Prueba Directa</a> y a la <a
href="http://www.webpagetest.org/result/120324_5F_3PYPA/">Prueba con Varnish</a>.</p><p>Como detalle, que no lo he podido capturar al 100%, el sistema hace 2 peticiones, la primera normal, luego refresca y usa la caché del navegador, y luego vuelve a repetir lo mismo. En el caso del acceso duirecto, WordPress ha de generar completamente la página, que tarda aproximadamente unos 2,5 segundos. Luego, en cualquier caso, el refresco es rápido, y tarda muy poco. Cuando estos e hace con Varnish delante, la primera ocasión tarda lo mismo, pero cuando vaciamos la caché del navegador como ya no se genera la página, tarda tan sólo 1,5 segundos.</p><table
style="width: 500px;"><tr><td></td><td>Directo</td><td>Varnish</td></tr><tr><td>lectura 1</td><td>2.575s</td><td>2.765s</td></tr><tr><td>caché 1</td><td>1.238s</td><td>0.435s</td></tr><tr><td>lectura 2</td><td>2.172s</td><td>1.416s</td></tr><tr><td>caché 2</td><td>1.245s</td><td>0.315s</td></tr></table><p>En general, como los usuarios navegarán por las versiones de &#8220;lectura 2&#8243; (la lectura 1 sólo se ejecutará cuando haya contenido nuevo o se vacíe la caché), los datos muestran que <strong>el blog carga entre un 60% y un 75% más rápido</strong>. Os dejo con algunos otros gráficos:</p><p>En estos datos se ven los tiempos de respuesta que han obtenido mejor valoración en las 2 pruebas realizadas&#8230;</p><p>Acceso directo:<br
/>
<a
href="http://javiercasares.net/uploads/vwaas-directo-general.png"><img
src="http://javiercasares.net/uploads/vwaas-directo-general-550x125.png" alt="" title="vwaas-directo-general" width="550" height="125" class="aligncenter size-large wp-image-3720" /></a></p><p>Acceso por Varnish:<br
/>
<a
href="http://javiercasares.net/uploads/vwaas-varnish-general.png"><img
src="http://javiercasares.net/uploads/vwaas-varnish-general-550x130.png" alt="" title="vwaas-varnish-general" width="550" height="130" class="aligncenter size-large wp-image-3723" /></a></p><p>Aquí se muestra en una valoración simple los resultados que dan Google Page Speed y Yahoo! YSlow&#8230;</p><p>Acceso directo:<br
/>
<a
href="http://javiercasares.net/uploads/vwaas-directo-letras.png"><img
src="http://javiercasares.net/uploads/vwaas-directo-letras.png" alt="" title="vwaas-directo-letras" width="426" height="105" class="aligncenter size-full wp-image-3721" /></a></p><p>Acceso por Varnish:<br
/>
<a
href="http://javiercasares.net/uploads/vwaas-varnish-letras.png"><img
src="http://javiercasares.net/uploads/vwaas-varnish-letras.png" alt="" title="vwaas-varnish-letras" width="404" height="106" class="aligncenter size-full wp-image-3724" /></a></p><p>Y finalmente un checklist de todas las peticiones que se han relalizado&#8230;</p><p>Acceso directo:<br
/>
<a
href="http://javiercasares.net/uploads/vwaas-directo-checklist.png"><img
src="http://javiercasares.net/uploads/vwaas-directo-checklist-550x207.png" alt="" title="vwaas-directo-checklist" width="550" height="207" class="aligncenter size-large wp-image-3719" /></a></p><p>Acceso por Varnish:<br
/>
<a
href="http://javiercasares.net/uploads/vwaas-varnish-checklist.png"><img
src="http://javiercasares.net/uploads/vwaas-varnish-checklist-550x209.png" alt="" title="vwaas-varnish-checklist" width="550" height="209" class="aligncenter size-large wp-image-3722" /></a></p><p>En fin, creo que es bastante obvio que usar Varnish es una gran ventaja competitiva con respecto a los sitios que no lo tienen&#8230;</p><p>Otra prueba interesante es hacer un test de estrés. La idea es hacer crecer las peticiones simultáneas al sitio&#8230; el test lleva un 50% de visitas desde Dublín (IE) y un 50% de visitas desde Palo Alto (CA, US), hasta las 100 conexiones simultáneas. Las gráficas son bastante clarificadoras&#8230;</p><p>Enlaces a los resultados de la <a
href="http://loadimpact.com/load-test/onlymiamibeach.com-b83e9b91e23cc15f881f7ba56964d277">Prueba Directa</a> y a la <a
href="http://loadimpact.com/load-test/onlymiamibeach.com-864a7283b5102047245d5bc28623e498">Prueba con Varnish</a>. Creo que las gráficas hablan por sí solas&#8230;</p><p>Tiempos de carga por página:</p><table
style="width: 600px;"><tr><td>Clientes</td><td>15</td><td>31</td><td>51</td><td>70</td><td>85</td><td>100</td></tr><tr><td>Directo</td><td>1.63s</td><td>2.71s</td><td>3.98s</td><td>17.26s</td><td>21.18s</td><td>26.54s</td></tr><tr><td>Varnish</td><td>1.27s</td><td>1.14s</td><td>1.20s</td><td>1.28s</td><td>1.48s</td><td>1.27s</td></tr></table><p>Acceso directo:<br
/>
<a
href="http://javiercasares.net/uploads/vwaas-directo-estres.png"><img
src="http://javiercasares.net/uploads/vwaas-directo-estres-550x277.png" alt="" title="vwaas-directo-estres" width="550" height="277" class="aligncenter size-large wp-image-3725" /></a></p><p>Acceso por Varnish:<br
/>
<a
href="http://javiercasares.net/uploads/vwaas-varnish-estres.png"><img
src="http://javiercasares.net/uploads/vwaas-varnish-estres-550x277.png" alt="" title="vwaas-varnish-estres" width="550" height="277" class="aligncenter size-large wp-image-3726" /></a></p><p>¿Te gustaría probarlo? Pues <a
href="mailto:javier.casares@kisslab.com">si te interesa puedes escribirme</a> (si me adelantas el dominio en que lo quieres probar, mejor que mejor) y te escribo con todos los pasos. Por ahora vamos a dar una semana de pruebas a aquellos que lo quieras testear en su sitio (ya sea por fichero de <em>host</em> o en producción) y a partir de ahí valdrá 120 euros/año u 80 euros/semestre.</p>
]]></content:encoded>
<wfw:commentRss>http://javiercasares.com/blog/varnish-for-wordpress-as-a-service/feed/</wfw:commentRss>
<slash:comments>16</slash:comments>
</item>
<item><title>Varnish User Group Meeting 5 #VUG5</title><link>http://javiercasares.com/blog/varnish-user-group-meeting-5/</link>
<comments>http://javiercasares.com/blog/varnish-user-group-meeting-5/#comments</comments>
<pubDate>Fri, 23 Mar 2012 15:09:45 +0000</pubDate>
<dc:creator>Javier Casares</dc:creator>
<category><![CDATA[Eventos]]></category>
<category><![CDATA[París]]></category>
<category><![CDATA[Varnish]]></category>
<guid
isPermaLink="false">http://javiercasares.com/?p=3708</guid>
<description><![CDATA[Varnish Caché es un software muy especial, sobre todo desde que ha conseguido que, como dice su eslogan, las webs &#8220;vuelen&#8221;. Y es que sin duda una capa intermedia de web-caché que prácticamente no influye en nada en la configuración &#8230; <a
href="http://javiercasares.com/blog/varnish-user-group-meeting-5/">Sigue leyendo <span
class="meta-nav">&#8594;</span></a>]]></description>
<content:encoded><![CDATA[<p><img
src="http://javiercasares.net/uploads/IMAG0026-179x300.jpg" alt="" title="IMAG0026" width="179" height="300" class="alignright size-medium wp-image-3712" />Varnish Caché es un software muy especial, sobre todo desde que ha conseguido que, como dice su eslogan, las webs &#8220;vuelen&#8221;. Y es que sin duda una capa intermedia de web-caché que prácticamente no influye en nada en la configuración del sitio es mágico. Ayer tuve la oportunidad de estar en el <a
href="https://www.varnish-cache.org/vug5">Varnish User Group Meeting 5</a> y conocer a parte del equipo de Varnish y conocer otros proyectos y empresas que utilizan este software. Voy a intentar hacer un pequeño resumen de algunas de las charlas que me parecieron más interesantes.</p><p>Para comenzar, Poul-Henning Kamp -<a
href="https://twitter.com/#!/bsdphk">@bsdphk</a>- (si no me equivoco es el desarrollador jefe del software) explicó algunas ideas que tienen del <em>roadmap</em> hasta 2020, y lo curioso es que casi no explicó nada del propio sistema, sino de cómo van a ser los protocolos de Internet en los próximos años.</p><p>En 2006 Varnish simplemente era un web-caché, que permitía la propia caché, el sistema de configuración por VCL y los &#8220;baneos&#8221; (limpieza de caché desde el sistema de administración). En 2009 se introdujo el &#8220;purgado&#8221; (limpieza de caché desde fuera del panel) y la implementación de parte del <a
href="http://www.w3.org/TR/esi-lang">estándar ESI</a>. En 2012 con la versión 3.0 se ha implementado el sistema de VMODs (módulos, plugins&#8230; como queráis), soporte a gZip&#8230;</p><p>¿Qué cosas podría llevar Varnish en las próximas versiones? Pues parece que Virtualización de VCL (por ejemplo, distintos dominios, distintos VCL), <em>buffering</em> del ESI (ahora hay problemas de cabeceras) y posibilidad de soporte de otros protocolos: UNIX sockets, fastcgi, SCTP, HTTP/2.0, SPDY o SSL.</p><p>De todo lo que comentó, quizá lo que más me llamó la atención es el tema del <a
href="http://tools.ietf.org/wg/httpbis/">HTTP/2.0</a> (también conocido como <em>HTTPbis</em>). En la última documentación, la información casi se ha duplicado con respecto al RFC2616, lo que significa que en vez de simplificarse se ha complicado muchísimo. hay 3 objetivos básicos en esta nueva versión: Velocidad (<em>pipeling</em>, <em>multiplexion</em>, <em>header compression</em>&#8230;), Confianza (<em>privacy</em>, <em>integrity</em>, <em>identity</em>, <em>auth</em>&#8230;) y Servicio (<em>sessions</em>&#8230;).</p><p>Un planteamiento que se ha hecho es que SPDY sea el próximo HTTP 2, pero lo malo de ello es que es un protocolo proporcionado por Google y que para ello hay que seguir la agenda del gigante de Mountain View. Además, el SSL es mandatario&#8230; así que lo que ganas por un lado lo pierdes por otro. El objetivo de SPDY es evitar que los proveedores de telecomunicaciones (o sea, el que te da la conexión) sea capaz de saber qué envías o recibes y con quién te comunicas. Otra opción sería separar el <em>transport</em> del <em>semantics</em>, y que el transporte sea por &#8220;plugins&#8221;; algo rollo HTTP sobre: TCP, SSL, UDP, SPDY, SCTP, ECMA-10&#8230; El problema será, a parte de saber qué protocolo implementar, cómo luego se comunicará Varnish con los distintos backends. En el momento en el que se de soporte a protocolos múltiples, se añadirán algunos como soporte para vídeos, etc&#8230; aunque por ahora se sigue centrando en HTTP. Aun así, se plantean que los protocolos de <em>streaming</em> tienden a desaparecer.</p><p>Otro tema interesante del que se habló es dónde se almacena la información&#8230; se habló del uso de disco normal, de SSD, de memoria.. y salió un tema de conversación muy interesante en torno a el uso de Varnish en modo Cluster. En principio la gente está escalando usando múltiples Varnish. Incluso se habló del uso de discos en modo NFS, para tener alta disponibilidad. A la vuelta de París se me vino a la cabeza el porqué no se usa algún sistema tipo Hadoop como almacenamiento&#8230; aunque supongo que para eso habría que acabar de adecuar el software. Como dato interesante: Varnish soporta perfectamente la gestión de 10 millones de elementos sin ninguna caída en cuanto al rendimiento.</p><p>Otra de las charlas, en este caso de <a
href="http://www.linkedin.com/in/richardzuidhof">Richard Zuidhof</a> comentó varios temas aunque hubo uno que sí que me gustaría destacar (y que a mi a veces me ha dado algún que otro dolor de cabeza) y es el de los <em>timeouts</em>. Por ejemplo, pusieron algunos ejemplos y mucha gente dio cifras, pero me quedo con un par de ellas:</p><pre><code>backend localhost {
	[...]
	.first_byte_timeout = 1s;
	.between_bytes_timeout = 1s;
	[...]
}</code></pre><p>Lógicamente, estos ería para peticiones internas a la propia máquina, pero como valores &#8220;normales&#8221; se pusieron estos:</p><pre><code>backend default {
	[...]
	.first_byte_timeout = 180s;
	.between_bytes_timeout = 120s;
	[...]
}</code></pre><p>Personalmente yo reduciría mushísimo estos valores, porque tampoco tiene sentido tener estas cifras tan altas&#8230; y las dejaría en:</p><pre><code>backend default {
	[...]
	.first_byte_timeout = 10s;
	.between_bytes_timeout = 5s;
	[...]
}</code></pre><p>Creo que si una página tarda más de 10 segundos en conectar ya debe dar ese <em>timeout</em> y que si entre petición y petición hay más de 5 segundos de diferencia, también ha de &#8220;fallar&#8221;.</p><p><img
src="http://javiercasares.net/uploads/varnish-timeouts-550x328.jpg" alt="" title="varnish-timeouts" width="550" height="328" class="aligncenter size-large wp-image-3711" /></p><p>Lasse Karstensen <a
href="https://twitter.com/#!/lkarsten">@lkarsten</a> estuvo comentando bastante un tema muy interesante que afecta a SEO y afecta a cosas que leía hace unos días desde Bing / Microsoft, la detección de dispositivos desde Varnish. El objetivo sería tener algo como una cabecera <em>X-UA-Device</em> que mediante un <em>Vary</em> pueda cachear cada una de las páginas resultantes según el dispositivo. Para ello existen un par de herramientas:</p><ul><li><a
href="https://github.com/varnish/varnish-devicedetect">varnish-devicedetect</a> VCL</li><li><a
href="https://www.varnish-cache.org/vmod/deviceatlas-mobile-detection">deviceatlas-mobile-detection</a> (dotMobi DeviceAtlas)</li></ul><p>Como ejemplos tenemos varios directamente en la <a
href="https://www.varnish-cache.org/docs/trunk/tutorial/devicedetection.html">documentación sobre detección de dispositivos de Varnish</a>.</p><p>Otro que comentó cosas interesantes fue Andreas Plesner, hablando sobre cómo evitar que Varnish <em>pete</em>. No voy a entrar en profundidad, pero se habló del <a
href="https://www.varnish-cache.org/trac/wiki/VCLExampleSaintMode">Saint_Mode</a> (y si no recuerdo mal existe el <a
href="https://www.varnish-cache.org/docs/trunk/tutorial/handling_misbehaving_servers.html">GOD_Mode</a>) además del más conocido Grace_Mode. Otra cosa interesante es comenzar a diferenciar el HIT del PASS del <a
href="http://kristianlyng.wordpress.com/2010/01/08/hitpass-objects-and-varnish/">HIT_FOR_PASS</a>. Otro detalle interesante es el de establecer, de forma forzada, un <em>Set-Connection: Close</em> cuando haya conexiones &#8220;pipe&#8221;.</p><p><img
src="http://javiercasares.net/uploads/varnish-pipe-550x328.jpg" alt="" title="varnish-pipe" width="550" height="328" class="aligncenter size-large wp-image-3714" /></p><p>Uno de los ejemplos prácticos del día lo puso <a
href="http://www.linkedin.com/pub/lionel-touati/0/16b/a7a">Lionel Touati</a>, responsable de tecnología de <a
href="http://www.maisonsdumonde.com/ES/es/">Maisons du Monde</a>, un sitio web de comercio electrónico de decoración  elementos del hogar. Su sitio web está creado por ellos y cada semana hacen una actualización. Su obsesión por el SEO ahora se enfoca e el Web performance, y para ello han implementado Varnish a un nivel muy profundo. Aún así, tan sólo cachean un 30% de las peticiones. Eso sí, el hecho de reducir el tiempo de carga se ha visto directamente relacionado con el aumento de páginas vistas, como nos enseñó.</p><p><img
src="http://javiercasares.net/uploads/varnish-maison-550x328.jpg" alt="" title="varnish-maison" width="550" height="328" class="aligncenter size-large wp-image-3715" /></p><p>Otro que dio una charla muy interesante fue <a
href="http://www.linkedin.com/pub/kacper-wysocki/2/551/758">Kacper Wysocki</a>, entusiasmado de la seguridad y que estuvo explicando cómo usar Varnish simplemente como un Web-Firewall, como lo llama él. Seguro que habéis escuchado sobre el <a
href="http://www.modsecurity.org/projects/modsecurity/apache/">mod_security de Apache</a>; pues con el <a
href="https://github.com/comotion/security.vcl">secure.vcl</a> más o menos se trabaja en lo mismo, con la diferencia de que activar y desactivar elementos es muy sencillo. Una herramienta muy interesante para testear el funcionamiento es el <a
href="https://www.owasp.org/index.php/OWASP_Zed_Attack_Proxy_Project">OWASP Zed Attack Proxy Project</a>, que incluye ataques prefabricados a distintos software para ver sus vulnerabilidades.</p><p>Como comentaba al principio, entre las cosas que lleva Varnish en esta tercera versión ha sido la incorporación de los &#8220;Varnish Modules&#8221;, los VMODs. Pues Varnish ha lanzado un <a
href="https://www.varnish-cache.org/vmods">directorio con algunos módulos</a> que ya se pueden implementar en el sistema. El objetivo es hacer crecer esta lista, sobre todo con la aportación de los códigos de los usuarios.</p><p>Y para acabar, un par de sistemas interesantes que vienen de la mano de Opera Software. El primero de ellos es un <a
href="https://github.com/cosimo/varnish-accept-language">sistema que estandariza el Accept-Language</a> y <a
href="https://github.com/cosimo/varnish-geoip">otro que trabaja con el GeoIP</a>. Para aquellos proyectos multi idioma y multi país estos ficheros serán básicos a la hora de implementarse en la configuración de la plataforma.</p><p>En medio año se llevará a cabo el VUG6, y probablemente sea en Argentina&#8230; y si es así, creo que también me acercaré, porque desde <a
href="http://keepitsimplelab.com/">Keep It Simple Lab</a> estamos preparando a montar varias ideas trabajando sobre Varnish y que tienen que ver con WordPress, Magento y otros proyectos que harán que, como bien dice el eslogan de Varnish, tu sitio web vuele. dar las gracias a <a
href="http://www.linkedin.com/in/rubenvarnish">Rubén Romero</a> <a
href="https://twitter.com/#!/ruben_varnish">@ruben_varnish</a> por la organización y a la espera de que en un futuro (espero que no muy lejano) participen en los <a
href="http://webperf.es/">eventos WebPerf de España</a>.</p><p>Y hasta aquí la visita a París, ciudad que no pisaba desde hacía unos 18 años&#8230; cuando un chaval de 8º de EGB hacía el viaje de fin de curso a la ciudad.</p><p><img
src="http://javiercasares.net/uploads/IMAG0077-328x550.jpg" alt="" title="IMAG0077" width="328" height="550" class="aligncenter size-large wp-image-3713" /></p>
]]></content:encoded>
<wfw:commentRss>http://javiercasares.com/blog/varnish-user-group-meeting-5/feed/</wfw:commentRss>
<slash:comments>3</slash:comments>
</item>
<item><title>Guía de HTML Data</title><link>http://javiercasares.com/blog/guia-html-data/</link>
<comments>http://javiercasares.com/blog/guia-html-data/#comments</comments>
<pubDate>Sun, 18 Mar 2012 14:25:13 +0000</pubDate>
<dc:creator>Javier Casares</dc:creator>
<category><![CDATA[MicroDatos]]></category>
<guid
isPermaLink="false">http://javiercasares.com/?p=3703</guid>
<description><![CDATA[En los últimos años microformatos, microformatos-2, RDFa o microdatos se han convertido en elementos básicos de la construcción del HTML siempre que hemos querido darle información semántica a las máquinas, a los robots de búsqueda. Pero ¿estás usándolos realmente de &#8230; <a
href="http://javiercasares.com/blog/guia-html-data/">Sigue leyendo <span
class="meta-nav">&#8594;</span></a>]]></description>
<content:encoded><![CDATA[<p>En los últimos años <em>microformatos</em>, <em>microformatos-2</em>, <em>RDFa</em> o <em>microdatos</em> se han convertido en elementos básicos de la construcción del HTML siempre que hemos querido darle información semántica a las máquinas, a los robots de búsqueda. Pero ¿estás usándolos realmente de forma correcta?</p><p>La respuesta a esta pregunta siempre la hemos de buscar en la información que el organismo de crear los estándares de desarrollo web nos ofrece, y para esto existe la <a
href="http://www.w3.org/TR/html-data-guide/" hreflang="en">HTML data Guide</a> donde nos encontramos con un resumen bastante interesante de su funcionamiento.</p><p>Antes de nada, poner los enlaces a las páginas oficiales de cada uno de estos lenguajes de marcas que os he comentado al inicio:</p><ul><li><a
href="http://microformats.org/">Microformatos</a> y <a
href="http://microformats.org/wiki/microformats-2">Microformatos 2</a></li><li><a
href="http://www.w3.org/TR/xhtml-rdfa-primer/">RDFa</a> (y <a
href="http://www.w3.org/TR/rdfa-syntax/">sintáxis</a>)</li><li><a
href="http://www.w3.org/TR/microdata/">microdatos</a></li></ul><p>Todos estos elementos tienen una cosa en común, y es que permiten extraer información de páginas HTML de forma sencilla, y me atrevería a decir que información inteligente y semántica.</p><p>En la actualidad, como vengo comentando, <strong>existen tres sintaxis principales</strong>:</p><p><strong>Microformatos</strong></p><p>Los microformatos usan <em>@class</em>, <em>@rel</em> y otros atributos para codificar datos en HTML. Además pueden usarse con cualquier lenguaje de marcas que use atributos <em>@class</em>. Hsta el momento los microformatos tenían varios vocabularios para hacer diferentes cosas, pero con los <strong>Microformatos 2</strong> esto se ha estandarizado a un sistema único de proceso.</p><p><strong>RDFa</strong></p><p>El RDFa reutiliza código HTML existente como <em>@href</em> y <em>@rel</em> añadiéndole pequeñas partes más que permiten extraer información (como ya ocurre con el RDF). Estaba pensado originalmente para el <em>XHTML 1.1</em> y es compatible con <em>HTML 5</em> y <em>SVG</em>.</p><p><strong>microdatos</strong></p><p>Los microdatos añaden atributos al HTML 5, de forma que cualquier elemento pueda tener una serie de propiedades y valores. Estos están diseñados para añadir información detallada que pueda ser procesada por los usuarios.</p><blockquote
id="nota1"><p><strong>NOTA 1</strong>: Los microdatos SÓLO funcionan con HTML 5, por lo que aunque pongas cosas como Schema, si tu web no es HTML 5 buscadores como Bing o Google no &#8220;interpretarán&#8221; la información que les has dado porque no cumplen con el estándar.</p></blockquote><blockquote
id="nota2"><p><strong>NOTA 2</strong>: Bing tiene la herramienta <a
href="http://www.bing.com/toolbox/EntityExtraction">Markup Validator</a>, Google el <a
href="http://www.google.com/webmasters/tools/richsnippets">Rich Snippets Testing Tool</a> y Yandex el <a
href="http://webmaster.yandex.com/microtest.xml">Microformat validator</a> para verificar la mayoría de estas sistaxis. Además existen herramientas como el <a
href="http://www.w3.org/2012/pyRdfa/Validator.html">RDFa Validator</a> o el <a
href="http://validator.nu/">Living Validator</a>, este último aceptando en principio todos los formatos y sistemas.</p></blockquote><p>La forma de aplicar estos sistemas es triple también. Se puede hacer mediante la inclusión en la cabecera de la página de metadatos, como por ejemplo en elemento <em>link</em> con un <em>rel=&#8221;alternate&#8221;</em>:</p><pre><code>&lt;link rel="alternate" type="text/calendar" value="calendar.ics"&gt;</code></pre><p>La otra opción es la de incrustar código dentro del propio código HTML, aún en la cabecera. Para ello se podrían usar elementos como <em>JSON</em> o <em>Turtle</em>, algo similar a esto:</p><pre><code>&lt;script type="text/turtle"&gt;
  @prefix foaf: &lt;http://xmlns.com/foaf/0.1/&gt; .
  @prefix gr: &lt;http://purl.org/goodrelations/v1#&gt; .
  @prefix vcard: &lt;http://www.w3.org/2006/vcard/ns#&gt; .
  @prefix xsd: &lt;http://www.w3.org/2001/XMLSchema#&gt; .
  &lt;#company&gt; gr:hasPOS &lt;#store&gt; .
  &lt;#store&gt; a gr:Location ;
    gr:name "Hair Masters" ;
    vcard:adr [
      a vcard:Address ;
      vcard:country-name "USA" ;
      vcard:locality "Sebastpol" ;
      vcard:postal-code "95472" ;
      vcard:street-address "6980 Mckinley Ave" ;
    ] ;
    foaf:page &lt;&gt; ;
    .
&lt;/script&gt;</code></pre><p>Para acabar, quizá la actualmente más conocida, es la de incrustar meta información en el cuerpo de la página, a través de los <a
href="http://dev.w3.org/html5/spec/global-attributes.html#custom-data-attribute">atributos custom data</a> válidos sólo en <em>HTML 5</em>.</p><pre><code>&lt;div class="spaceship" data-ship-id="92432"
     data-weapons="laser 2" data-shields="50%"
     data-x="30" data-y="10" data-z="90"&gt;
 &lt;button class="fire"
      onclick="spaceships[this.parentNode.dataset.shipId].fire()"&gt; Fire
 &lt;/button&gt;
&lt;/div&gt;</code></pre><p>Para acabar, un poco de terminología, para entender bien las palabras que debemos usar cuando hablemos de esto:</p><ul><li><strong>Formato</strong> es la combinación de <em>Sintaxis</em>, <em>Tipos</em>, <em>Propiedades</em> de una o más <em>Vocabularios</em>.</li><li><strong>Sintaxis</strong> son las distintas formas de organizar la información. En este caso hemos hablado de microformatos, RDFa y microdatos.</li><li><strong>Vocabulario</strong> es cada uno de los conjuntos que permite cada sintaxis formado por entidades. Por ejemplo el microdato &#8220;producto&#8221; o el microformato &#8220;hcard&#8221;.</li><li><strong>Entidad</strong> es cada uno de los pequeños elementos por las que se forma un Vocabulario. Por ejemplo el nombre de una persona, una dirección&#8230; Cada entidad tiene uno o más <strong>Tipos</strong> de datos, y estos tipos de datos tienen una serie de <strong>Propiedades</strong> con sus respectivos <strong>Valores</strong>.</li></ul><p>A la hora de publicar información lo más sencillo es publicar y mantener tan sólo un tipo de vocabulario por página. En caso de estar utilizando HTML 5 es más que recomendable usar los microdatos, ya que son los que permiten mayor extensibilidad; en cualquier otro dato los microformatos son la opción más adecuada. El RDFa prácticamente no se utiliza.</p><blockquote
id="nota3"><p><strong>NOTA 3</strong>: Por ahora mi experiencia personal es que Google sólo lee el primero de los vocabularios que se incluyen en una página. Hay que recordar que muchas entidades se pueden anidar, por lo que es mejor utilizar el vocabulario principal y no usar varios.</p></blockquote><p>Aunque el estándar permite el cruce de distintas sintaxis en una página, hoy en día, teniendo en cuenta que la mayoría de webmasters que publicarán vocabularios en sus páginas lo hacen por un tema puro y duro de SEO, casi es mejor limitarse a uno de ellos que, como decía antes, si se dispone de HTML 5 en el sitio, es el óptimo.</p><p>Una gran diferencia entre microformatos + RDFa y los microdatos es que las propiedades de cada entidad están bastante establecidas; esto significa que los microformatos no son extensibles y han de adaptarse al 100% a lo que el estándar permite, pero, en contra, los microdatos pueden seguir el estándar y pueden tener valores no estándar, lo que permite su escalabilidad de forma infinita.</p><p>En cambio, hay una cosa en contra de los microdatos, y es que es bastante más difícil el uso de los multi idiomas en la información. Los microformatos permiten el uso de <em>@lang</em> como una propiedad, algo que los microdatos no permiten, por lo que se complica el uso.</p><p>Otra cosa a tener en cuenta es el diseño, el visual. Para una ficha de persona, por ejemplo, poner el nombre de la persona en negrita, en las tres sintaxis tendríamos un código tal que este:</p><p>microformatos:</p><pre><code>.hcard .n { font-weight: bold; }</code></pre><p>RDFa:</p><pre><code>[typeof~="foaf:Person"] [property~="foaf:name"]</code></pre><p>microdata:</p><pre><code>[itemtype~="http://microformats.org/profile/hcard"] [itemprop~="n"]</code></pre><p>Esto hace que, a nivel de uso de los <em>CSS</em> los microformatos sean una herramienta mucho más sencilla que el resto. Claro está, se pueden incluir clases y similares, pero sería información añadida que sólo sería útil en diseño y no en código fuente.</p><p>A la hora de <strong>gestionar fechas y horas</strong>, si queremos mezclar información y hacerla 100% compatible entre distintos formatos podríamos usar algo parecido a esto (que mezcla HTML 5 con otros elementos, haciéndolo completamente compatible; hay que tener en cuenta que el elemento <em>abbr</em> puede usarse para patrones de fechas).</p><pre><code>&lt;time itemprop="dtstart" property="startDate" content="2016-04-21T20:00:00"&gt;
  &lt;abbr class="dtstart" title="2016-04-21T20:00:00"&gt;
    Thu, 04/21/16 8:00 p.m.
  &lt;/abbr&gt;
&lt;/time&gt;</code></pre><p>En lo que respecta a relaciones de enlaces, HTML 5 incluye bastantes elementos <em>@rel</em> que son comprensibles, pero que no son compatibles con otros sistemas como RDFa. Lo que sí es compatible es el uso del <em>@vocab</em>, donde se informa del tipo de contenido que llevaría el enlace. Con esto podríamos conseguir algo similar a:</p><pre><code>&lt;a vocab="http://purl.org/dc/terms/"
   rel="date" href="http://reference.data.gov.uk/id/day/2011-11-15"&gt;
15th November 2011&lt;/a&gt;</code></pre><p>Con esto conseguiríamos que la relación del enlace fuera de tipo <em>dc:date</em>, es decir, que es una fecha, (basándonos en la información <a
href="http://dublincore.org/documents/dcmi-terms/">Dublin Core</a>).</p><p>A la hora de publicar contenido (o información) incrustado en el HTML debemos tener muy presente que <strong>las buenas prácticas imperan sobre cualquier cosa</strong>, ya que si el lenguaje de marcas es incorrecto la extracción de información se vuelve muy compleja. Por eso hay que tener muy presente el uso de un HTML válido. Todas las sintáxis necesitan de una estructura, ya que esto se basa en los datos estructurados, así que es básico cumplir con los estándares de HTML.</p><p>Como primera recomendación, es casi básico utilizar sistemas de lectura que permitan HTML 5, es decir, <strong>navegadores de última generación</strong>. Varios ejemplos son que, Firefox (y otros) no es capaz de procesar los elementos que no se pueden dejar dentro de una tabla y los sacan fuera de ella. Incluso, hay navegadores antiguos que los elementos <em>meta</em> o <em>rel</em> no pueden ser procesados en el <em>body</em> y son &#8220;movidos&#8221; al <em>head</em>, con las consecuencias de errores de proceso que ello genera.</p><p>Otra buena práctica es la de <strong>definir la licencia de uso de dicha información</strong>. Al fin y al cabo la información que se introduce es pública pero no por ello tiene porqué permitirse la reutilización de la misma. Así que, ya que todas las sintaxis lo permiten, es más que recomendable informar de la licencia de uso.</p><p>A la hora de procesar la información que nos ofrece el HTML mediante cualquiera de la sintaxis debemos tener en cuenta que hay dos formas principales de procesarse. La primera de ellas hace referencia a los microformatos 2 y a los microdatos. En ambos casos la información puede procesarse como <a
href="http://json-schema.org/">JSON</a> lo que permite un manejo muy sencillo de la información estructurada. En cambio, el RDFa puede expandise en múltiples opciones. Entre ellas la más habitual es la de convertirlo a <a
href="http://www.w3.org/TR/rdf-syntax-grammar/">RDF/XML</a> o a <a
href="http://www.w3.org/TR/turtle/">Turtle</a>, aunque también se podría llegar a extraer vía <a
href="http://www.w3.org/TR/sparql11-overview/">SPARQL</a> o <a
href="http://www.w3.org/TR/rdfa-api/">RDFa API</a>.</p><p>Y si no encuentras tu vocabulario&#8230; ¿<strong>se pueden crear o proponer</strong>? Pues la respuesta es simple: sí. Aunque hay varias formas de llegar a hacer propuestas y a distintos niveles. Por ejemplo, existe una página en la que se detalla <a
href="http://microformats.org/wiki/process">cómo proponer un microformato</a>, el W3C tiene su <a
href="http://www.w3.org/2001/sw/interest/">Semantic Web Interest Group</a> para crear elementos ya más oficiales e incluso el grupo de Schema (en el que participan los principales motores de búsqueda) tiene el <a
href="http://schema.org/docs/extension.html">Extension Mechanism</a> en el que no sólo se puede crear un nuevo schema, sino que se pueden extender los actuales, y si mucha gente lo adopta el propio sistema lo tomaría para crear el estándar. En cualquier caso, y mirando hacia el futuro, si vas a crear algo, mi recomendación es que te bases en el <a
href="http://www.w3.org/TR/microdata/">estándar de microdata del W3C</a>, responsable del cuál, además, es <a
href="mailto:ian@hixie.ch">Ian Hickson</a> (trabajador de Google).</p><p>Y en principio todo esto es lo que hay que saber sobre el tratamiento y la incrustación de datos dentro del HTML. Por supuesto no he tratado en detalle ninguno de los vocabularios, pero eso ya depende de cada proyecto y desarrollador (e incluso usuario). Lo que sí que voy a decirte es que, si tienes información estructurada, exista ya o no un sistema estándar, asímate a utilizar el que hay y sino créatelo tú mismo siguiendo las bases que existen.</p>
]]></content:encoded>
<wfw:commentRss>http://javiercasares.com/blog/guia-html-data/feed/</wfw:commentRss>
<slash:comments>17</slash:comments>
</item>
<item><title>Splunk Live 2012 Barcelona</title><link>http://javiercasares.com/blog/splunk-live-2012-barcelona/</link>
<comments>http://javiercasares.com/blog/splunk-live-2012-barcelona/#comments</comments>
<pubDate>Tue, 13 Mar 2012 17:45:22 +0000</pubDate>
<dc:creator>Javier Casares</dc:creator>
<category><![CDATA[Tecnología]]></category>
<guid
isPermaLink="false">http://javiercasares.com/?p=3697</guid>
<description><![CDATA[Esta mañana he podido asistir al primer evento oficial de Splunk en España, de la mano de OpenS3 en Barcelona y como me ha parecido interesante algunas de las cosas que se han comentado, os las dejo. Splunk comenzó en &#8230; <a
href="http://javiercasares.com/blog/splunk-live-2012-barcelona/">Sigue leyendo <span
class="meta-nav">&#8594;</span></a>]]></description>
<content:encoded><![CDATA[<p>Esta mañana he podido asistir al primer evento oficial de <a
href="http://www.splunk.com/">Splunk</a> en España, <a
href="http://www.open3s.com/events/splunklive_2012/">de la mano de OpenS3</a> en Barcelona y como me ha parecido interesante algunas de las cosas que se han comentado, os las dejo.</p><p>Splunk comenzó en 2004 en San Francisco y tiene más de 400 empleados en 8 países. Las principales oficinas están en Hong Kong y Londres. Tienen más de 3500 clientes de 70 países, de los cuales 48 están en el Fortune 100.</p><p>Hay muchos casos en los que Splunk está analizando más de 10 TB diarios de información. Algunas empresas como Facebook, eBay, Linkedin, Sony, BBC, Symantec y otros están utilizando esta herramienta. Con sistemas similares a MapReduce no hay limitación en cuanto a la escalabilidad de la plataforma. Cisco además de ser un cliente es un partner en cuanto en algunos casos integran en sus sistemas Splunk. Según Cisco, Splunk es el único software capaz de interpretar cualquiera de los logs que se generan en las máquinas de Cisco, y no como en otros casos que tienen muchos pequeños productos que leen una parte de la información.</p><p>Splunk además es una gran herramienta de seguridad, ya que es pro activa en analizar comportamiento extraños en los logs. Por ejemplo, si estás recibiendo un ataque desde una serie de direcciones rusas, sería capaz de detectar qué máquina o qué servicio es el que está enviando o recibiendo esta información. A parte de logs, es capaz de recibir información de bases de datos, GPS, registros de sistema, cualquier elemento que se pueda concebir como &#8220;datos IT&#8221;. Esta información, además de ser útil para los técnicos, puede ser útil para marketing o seguridad.</p><p>Otra de las funcionalidades interesantes de Splunk es la posibilidad de ser utilizado como sistema de Web Analytics, aunque es una pequeña parte del sistema, es capaz de analizar cualquiera de los elementos: páginas, vídeos, imágenes&#8230;</p><p>Splunk se divide en 3 partes: <em>Collectors</em>, <em>Indexers</em> y <em>Search Heads</em> (que es la web donde se ve la información). Se puede escalar horizontalmente, tienen alta disponibilidad y podría recoger unos 25 GB diarios. Cada máquina podría ser un quad-core con 8GB de RAM. El despliegue es bastante rápido y es capaz de usarse independientemente de cada lugar. Los Indexer pueden estar geolocalizados y el Search Head cercano a donde los usuarios lo van a utilizar.</p><p>El sistema es capaz de interpretar expresiones regulares para los distintos elementos que pueden encontrarse en los logs, de forma que es capaz de interpretar cualquier tipo de fichero. Es capaz de monitorizar el sistema de ficheros, registros del sistema operativo, control de hypervisores de máquinas virtuales, aplicaciones web, tablas o esquemas en bases de datos, configuraciones de red&#8230;</p><p>Splunk aparece como base como un buscador al estilo de Google en el que puedes realizar cualquier tipo de datos (buscar una IP, una dirección URL&#8230;) además de permitir generar informes personalizados en base a la información recogida. Además se puede hacer seguimiento de transacciones. Un ejemplo podría ser que un sitio web genere un identificador de una venta, se cruzan datos con que se haya enviado un correo avisando de la venta al usuario, y finalmente que el paquete (logística) se haya enviado.</p><p>Splunk tiene un sistema de geolocalización de direcciones IP, de forma que se podría analizar de una forma muy sencilla y mostrar o geolocalizar las visitas con mucho detalle (dependiendo incluso de qué sea, con datos de coordenadas GPS).</p><p>Existe un repositorio de paneles ya creados que analizan directamente los logs o datos. Muchas de estas extensiones están realizados directamente por la gente de Splunk aunque hay una gran comunidad detrás generando estos paneles.</p>
]]></content:encoded>
<wfw:commentRss>http://javiercasares.com/blog/splunk-live-2012-barcelona/feed/</wfw:commentRss>
<slash:comments>4</slash:comments>
</item>
<item><title>Evento Web Performance</title><link>http://javiercasares.com/blog/evento-web-performance/</link>
<comments>http://javiercasares.com/blog/evento-web-performance/#comments</comments>
<pubDate>Mon, 05 Mar 2012 10:09:37 +0000</pubDate>
<dc:creator>Javier Casares</dc:creator>
<category><![CDATA[WebPerf]]></category>
<guid
isPermaLink="false">http://javiercasares.com/?p=3695</guid>
<description><![CDATA[Gentes de Barcelona y Madrid, ¡preparaos! porque llegan los eventos WebPerf a España. Los que me conocéis sabéis que llevo trabajando desde hace bastante en este proyecto, en recuperar mi faceta de &#8220;montar eventos&#8221;, aunque esta vez no quiero montar &#8230; <a
href="http://javiercasares.com/blog/evento-web-performance/">Sigue leyendo <span
class="meta-nav">&#8594;</span></a>]]></description>
<content:encoded><![CDATA[<p>Gentes de Barcelona y Madrid, ¡preparaos! porque llegan los <a
href="http://webperf.es/">eventos WebPerf a España</a>.</p><p>Los que me conocéis sabéis que llevo trabajando desde hace bastante en este proyecto, en recuperar mi faceta de &#8220;montar eventos&#8221;, aunque esta vez no quiero montar un macro congreso como en otras ocasiones, sino que quiero algo más reducido y sobre todo de profesionales a profesionales del sector.</p><p><a
href="http://webperf.es/">WebPerf</a> está concebido como un evento formativo en el que más o menos en 2 horas podamos tratar algún tema concreto, de bajo o alto nivel, con un ponente que de una charla de 1 hora exponiendo su punto de vista y el resto del tiempo plantear dudas, sugerencias y que cualquiera pueda salir a la palestra a explicar lo que quiera.</p><p>Esto significa que el evento está dirigido a aquellos que se dedican, tecnológicamente hablando, en cuerpo y alma a mejorar los sitios web de Internet, ya sea mejorando el código fuente de una página concreta hasta montando la infraestructura de los centros de datos. Repito, para los que habéis preguntado ya: es un evento de tecnología, <em>de esos en los que se dicen palabras raras</em>.</p><p>El funcionamiento del evento será <a
href="http://groups.google.com/group/webperfes?hl=es">mediante una lista de correo</a> a la que se puede apuntar cualquiera desde la que se propondrán temas y se puede hablar con el resto de asistentes o de los apuntados. En esta lista se irán proponiendo temas a modo de <em>Call for Papers</em> para ir sacando ponentes que quieran tratarlos.</p><p>El lugar elegido será el de <a
href="http://www.salleurl.edu/">La Salle</a>, que nos ceden amablemente un aula con todo lo necesario para dar esa &#8220;clase&#8221; en la que podamos aprender. Por ahora comenzaremos en Barcelona, en abril y junio, y a partir de septiembre iremos intercalando Barcelona y Madrid.</p><p>¿Temas de los que se hablarán? Pues para comenzar en esta primera ocasión, y como avanzadilla, es probable que hagamos algo bastante accesible a todos, como es el <strong>Web Performance para WordPress</strong>, intentando ver el asunto desde el punto de vista de los plugins y hacer tunning del propio WordPress, y por otro del de montar una infraestructura como si fuera para una red de blogs, que soporte tranquilamente millones de visitas sin problema, al menos coste.</p><p>Pero esto es sólo el principio, más adelante trataremos temas como mejoras de software de comercio electrónico (como Magento o Prestashop), experiencias con Apache 2.4, cómo escalar MySQL, el uso de web-proxy como nginx o Varnish, elementos olvidados como la conectividad y mejoras como SPDY&#8230;</p><p>Y ahora unos pocos enlaces para poder estar pendiente de todo:</p><ul><li><a
href="http://webperf.es/">WebPerf</a>: La web donde habrá información propia del evento. Tiene secciones para <a
href="http://webperf.es/webperfbcn/">Barcelona</a> y <a
href="http://webperf.es/webperfmad/">Madrid</a>.</li><li><a
href="http://webperf.es/feed/">WebPerf feed</a>: Feed de noticias y artículos del sector (las mismas que aparecen en la cuenta de twitter).</li><li><a
href="https://twitter.com/WebPerfES">@WebPerfES</a>: Cuenta de twitter con noticias y artículos del sector del Web Performance.</li><li><a
href="https://twitter.com/WebPerfBCN">@WebPerfBCN</a>: Cuenta de twitter con información y seguimiento del evento de Barcelona.</li><li><a
href="https://twitter.com/WebPerfMAD">@WebPerfMAD</a>: Cuenta de twitter con información y seguimiento del evento de Madrid.</li></ul><p>Así que si eres del mundillo de Internet, de los que toca la parte más técnica, un ISP, desarrollador, administrador de sistemas o similar, prepárate, que ya tenemos un evento en el que reunirnos y <em>salir de la cueva</em> ;) <a
href="http://groups.google.com/group/webperfes?hl=es">Apúntate a la lista de correo</a> donde podrás estar informado o hacer consultas técnicas de las que tengas dudas.</p>
]]></content:encoded>
<wfw:commentRss>http://javiercasares.com/blog/evento-web-performance/feed/</wfw:commentRss>
<slash:comments>25</slash:comments>
</item>
<item><title>Search Congress Barcelona 2012</title><link>http://javiercasares.com/blog/search-congress-barcelona-2012/</link>
<comments>http://javiercasares.com/blog/search-congress-barcelona-2012/#comments</comments>
<pubDate>Thu, 01 Mar 2012 10:20:08 +0000</pubDate>
<dc:creator>Javier Casares</dc:creator>
<category><![CDATA[Eventos]]></category>
<category><![CDATA[Web Performance Optimization]]></category>
<guid
isPermaLink="false">http://javiercasares.com/?p=3676</guid>
<description><![CDATA[Estos días se está celebrando el Search Congress en Barcelona y una vez más me toca dar una charla. Este año es de Web Performance Optimization, y aunque es de sólo 30 minutos, creo que a los que no hayan &#8230; <a
href="http://javiercasares.com/blog/search-congress-barcelona-2012/">Sigue leyendo <span
class="meta-nav">&#8594;</span></a>]]></description>
<content:encoded><![CDATA[<p>Estos días se está celebrando el Search Congress en Barcelona y una vez más me toca dar una charla. Este año es de <a
href="http://javiercasares.com/wpo/">Web Performance Optimization</a>, y aunque es de sólo 30 minutos, creo que a los que no hayan escuchando nunca del tema les será mínimamente útil.</p><p>Hace ya un par años, en el Search Congress de Bilbao presenté algo que aún no llamaba WPO sino &#8220;<a
href="http://javiercasares.com/blog/presentacion-de-infraestructura-seo-del-search-congress/">infraestructura SEO</a>&#8221; en el que di los primeros pasos a tratar sobre todo este mundillo. Esta vez no he tenido las 3 horas que tuve la otra vez, sólo 30 minutos, así que como dicen por aquí &#8220;us faig cinc cèntims&#8221;.</p><p>Os dejo la presentación para <a
href="http://javiercasares.net/uploads/30minWPO.pdf">que la descarguéis si os interesa</a>, muy en la línea de seguir siendo un SEO Open Source.</p>
]]></content:encoded>
<wfw:commentRss>http://javiercasares.com/blog/search-congress-barcelona-2012/feed/</wfw:commentRss>
<slash:comments>8</slash:comments>
</item>
<item><title>Resetear la pila TCP/IP</title><link>http://javiercasares.com/blog/resetear-tcp-ip/</link>
<comments>http://javiercasares.com/blog/resetear-tcp-ip/#comments</comments>
<pubDate>Sun, 26 Feb 2012 11:13:56 +0000</pubDate>
<dc:creator>Javier Casares</dc:creator>
<category><![CDATA[Tecnología]]></category>
<category><![CDATA[Windows]]></category>
<guid
isPermaLink="false">http://javiercasares.com/?p=3673</guid>
<description><![CDATA[¿Te va mal la conexión? Cuando llevamos mucho tiempo usando un ordenador, instalando y desinstalando programas y, sobre todo, si utilizas mucho Internet o las redes internas en tu casa, en la empresa o donde sea, es probable que la &#8230; <a
href="http://javiercasares.com/blog/resetear-tcp-ip/">Sigue leyendo <span
class="meta-nav">&#8594;</span></a>]]></description>
<content:encoded><![CDATA[<p>¿Te va mal la conexión? Cuando llevamos mucho tiempo usando un ordenador, instalando y desinstalando programas y, sobre todo, si utilizas mucho Internet o las redes internas en tu casa, en la empresa o donde sea, es probable que la pila del TCP/IP (el protocolo de comunicación de, entre otras cosas, Internet) se haya quedado tocado por alguna configuración.</p><p>¿Cómo solventarlo? Pues en <strong>Windows</strong> (en general funciona en XP, Vista y 7) es bastante sencillo:</p><ol><li>Acceder a <code>Inicio</code> -> <code>Ejecutar</code> -> <code>cmd</code> (Ejecutar como Administrador)</li><li>Ejecutar el comando: <code>netsh int ip reset c:\resetlog.log</code></li><li>Ejecutar el comando: <code>netsh winsock reset</code></li><li>Reiniciar la máquina</li></ol><p>Muy recomendable, si se quiere investigar más, una lectura a <a
href="http://support.microsoft.com/kb/242468">cómo usar la herramienta Netsh</a>.</p><p>En Linux también existe un comando similar que permite hacer un reset a la pila&#8230;</p><ol><li>Acceder a la consola como administrador</li><li>Ejecutar el comando: <code>ifconfig eth0|grep "inet addr"|cut -d : -f 2 |cut -d " " -f 1</code></li><li>Reiniciar la máquina</li></ol><p>Espero que con esto consigáis notar cierta mejora en vuestra conectividad. <em>Mano de Santo, ¡oiga!</em></p>
]]></content:encoded>
<wfw:commentRss>http://javiercasares.com/blog/resetear-tcp-ip/feed/</wfw:commentRss>
<slash:comments>13</slash:comments>
</item>
<item><title>Invertir en infraestructura y sistemas</title><link>http://javiercasares.com/blog/invertir-en-sysadmins/</link>
<comments>http://javiercasares.com/blog/invertir-en-sysadmins/#comments</comments>
<pubDate>Fri, 24 Feb 2012 18:10:31 +0000</pubDate>
<dc:creator>Javier Casares</dc:creator>
<category><![CDATA[Mis Cosas]]></category>
<category><![CDATA[Tecnología]]></category>
<guid
isPermaLink="false">http://javiercasares.com/?p=3670</guid>
<description><![CDATA[En 1997 me encontré un problema cuando tuve que subir a la red de redes mi primer sitio web&#8230; a algunos les será reconocido un sitio llamado AngelFire&#8230; pues sí, ahí coloqué mi primera web&#8230; tiempo después lancé mi primer &#8230; <a
href="http://javiercasares.com/blog/invertir-en-sysadmins/">Sigue leyendo <span
class="meta-nav">&#8594;</span></a>]]></description>
<content:encoded><![CDATA[<p>En 1997 me encontré un problema cuando tuve que subir a la red de redes mi primer sitio web&#8230; a algunos les será reconocido un sitio llamado <a
href="http://en.wikipedia.org/wiki/Angelfire">AngelFire</a>&#8230; pues sí, ahí coloqué mi primera web&#8230; tiempo después lancé mi primer sitio con dominio propio que me alojó una persona que ya estaba metida en el sector y que me dio <em>hosting</em> gratis durante una larga temporada.</p><p>En 1999 tenía mi primer servidor dedicado, con mi propia IP, y pagando ya cada mes (o creo que cada 3) una pequeña cuota por tener un servicio decente para mis sitios&#8230; tras eso muchas idas y venidas probando alojamientos en varios proveedores del mundo hasta que acabé en mi proveedor actual, <a
href="http://www.kaos.es/">Kaos</a>, que era el ISP que tenía <a
href="http://grupoitnet.com/">Grupo ITnet</a> por aquellos 2003 cuando comencé a trabajar en la empresa.</p><p>Desde ahí he pasado de tener servidores (sí, en plural) dedicados a tener VPS (<a
href="http://en.wikipedia.org/wiki/Virtual_private_server">Virtual Private Server</a>), varios de ellos, que hoy en día me permiten escalar todas las aplicaciones. Si sumo los que tengo yo y los que tiene <a
href="http://keepitsimplelab.com/">Keep It Simple Lab</a> creo que debemos tener ahora mismo unas 11 máquinas, que no son pocas.</p><p>En estos últimos meses me he visto envuelto en la implementación de estrategias de infraestructura de varias empresas, empresas muy distintas pero que tienen una cosa en común: <strong>todas ganan dinero a través de Internet</strong>. Y al fin y al cabo los sitios web hoy en día son bastante similares&#8230; una base de datos (que suele necesitar una máquina con algo más de recursos que el resto), una máquina para el frontal web, a veces alguna otra máquina para cosas especiales (sitio SSL, algo que no se puede cachear y siempre ha de estar disponible, etc&#8230;) y últimamente una o muchas máquinas de web-proxy ya estén en el propio país o distribuidos por el mundo, según las necesidades del proyecto. Creo que algunos pensarán que &#8220;para qué quiero yo tantas máquinas si en una puedo meter el mySQL, el Apache, el correo y las DNS&#8221;. Sí, se puede, pero después de 15 años haciendo webs la experiencia me dice que hacer esto suele acabar mal, sobre todo si tienes proyectos &#8220;con cara y ojos&#8221;. Si tienes un simple WordPress, pues a lo mejor no te es necesario, pero si estás haciendo una tienda por la red, aunque sea pequeña, necesitas disponibilidad, alto rendimiento&#8230;</p><p>Si vamos a la parte de &#8220;hacer números&#8221; os puedo decir que aproximadamente invierto un 3% de lo que facturo en sistemas. Esta cifra porcentual es lo que mi socio <a
href="http://ferre.es/">Jaume</a> dice que viene a ser que &#8220;has de invertir en infraestructura lo que ganas en un día, todo el mes, como mínimo&#8221;. Es decir, que si facturas 3.000 euros al mes, debes gastarte al menos 100 euros en servidores, que es &#8220;el coste de estar un día sin servicio&#8221;. Que conste que no es una regla de oro, pero haciendo números es bastante aproximado a lo que un jefe puede <em>despotricar</em> cuando una web no funciona.</p><p>Y es que me hace gracia que, gente que se gana la vida con Internet, cuando le dices de gastarse 100 euros al mes en servidores se echa las manos a la cabeza&#8230; pues, qué queréis que os diga, con 100 euros mensuales se hacen maravillas en cuanto a servidores, ya que puedes tener 2-3 máquinas más que decentes que pueden servir 1.000 visitas/segundo sin pestañear. Que sí, que poca gente tiene 1.000 visitas/segundo, pero cuando tienes 50 sitios web pequeñas en un sitio, te aseguro que estos datos te pueden parecer bajos.</p><p>Otro detalle a tener en cuenta es dónde tienes los servidores, físicamente. Si tu sitio está enfocado a vender en España, has de tener los servidores en España, por la simple razón de la conectividad. Cada país tiene su propia red &#8220;gigante&#8221; de fibra que interconecta los operadores de telefonía / Internet con los ISP o con las redes más importantes, para ser más concretos, con los <a
href="http://www.idatagreen.com/">Centros de Datos</a>, a menos que tú te hagas tu propio miniISP en tu oficina y directamente uses una de las operadoras. En el momento en el que te vas a otro país, la interconexión es simplemente pésima. Las conexiones internacionales son bastante malas, y no sólo pasa aquí, pasa en general en todo el mundo.</p><p>Hoy en día parece que el tema del alojamiento web se haya convertido en un <em>commodity</em>. En parte sí lo es, el tema viene cuando tu sitio web tiene unas necesidades de <a
href="http://www.rubenortiz.es/">administración de sistemas</a> que no te va a dar tu proveedor de esos que por 1 euro te hace tu sitio web&#8230; porque, ¿sabes qué ocurre? que <em>cuando se te rompa la web</em> se limitarán a reiniciar tu servidor, y si sigue sin ir el problema sigues teniéndolo tú. Lo caro de los servidores web no son las máquinas&#8230; eso es más o menos barato, lo importante es tener una buena conectividad (sobre todo si tu negocio se basa en SEO, estaría bien pensar cómo llega Google a tu sitio web) y, sobre todo, tener bien configuradas las máquinas. A veces cambiar un simple número de 8M a 16M en el Apache o mySQL hace que una web funcione de muy mal a muy bien.</p><p>¿Qué te pensabas, que montar una web era algo tan sencillo como entrar por FTP y subir el sitio? Pues no, pero claro, a los administradores de sistemas que nos den&#8230; total, como ya tengo mi web funcionando ¿para qué voy a pagar a alguien que se preocupe de darme lo mejor?</p><p>NOTA: Sí, para los que no lo sepan, yo <strong>soy administrador de sistemas</strong>, que aunque no ejerzo en el día a día, sí que me preocupa el asunto. Si algún día hay huelga de <a
href="http://en.wikipedia.org/wiki/System_administrator">SysAdmins</a>, preparaos, porque el mundo se acabará.</p>
]]></content:encoded>
<wfw:commentRss>http://javiercasares.com/blog/invertir-en-sysadmins/feed/</wfw:commentRss>
<slash:comments>16</slash:comments>
</item>
<item><title>Acceso a sitios web desde aplicaciones web</title><link>http://javiercasares.com/blog/permisos-redes-sociales/</link>
<comments>http://javiercasares.com/blog/permisos-redes-sociales/#comments</comments>
<pubDate>Tue, 21 Feb 2012 11:51:00 +0000</pubDate>
<dc:creator>Javier Casares</dc:creator>
<category><![CDATA[Tecnología]]></category>
<guid
isPermaLink="false">http://javiercasares.com/?p=3666</guid>
<description><![CDATA[En muchos sitios hoy en día te puedes loguear desde tu cuenta de Google, Facebook, Twitter, Linkedin&#8230; pero en algunas ocasiones quieres dejar de dar acceso a esas herramientas que &#8220;leen&#8221; tus datos de las redes sociales y, por lo &#8230; <a
href="http://javiercasares.com/blog/permisos-redes-sociales/">Sigue leyendo <span
class="meta-nav">&#8594;</span></a>]]></description>
<content:encoded><![CDATA[<p>En muchos sitios hoy en día te puedes <em>loguear</em> desde tu cuenta de Google, Facebook, Twitter, Linkedin&#8230; pero en algunas ocasiones quieres dejar de dar acceso a esas herramientas que &#8220;leen&#8221; tus datos de las redes sociales y, por lo que sea, no hay posibilidad de darse de baja.</p><p>La solución es bastante sencilla, pero hay que tenerlo presente. Todos estos sitios que he mencionado antes disponen de unos paneles en los que dar o quitar acceso a estas otras herramientas que acceden contra ellas. De tanto en tanto vale la pena darle una ojeada a esas páginas para eliminar accesos &#8220;extraños&#8221; o simplemente hacer un pocod e limpieza y mantener tu casa un poco ordenada.</p><p><strong>Facebook</strong>:</p><p>Para Facebook hay que acceder a la <a
href="https://www.facebook.com/settings/?tab=applications">sección de aplicaciones</a> y una vez allí verás el listado de las mismas, la última fecha que han accedido a tu información y la posibilidad de editar los permisos o eliminar directamente la posibilidad de acceso.</p><p><strong>Twitter</strong>:</p><p>Para twitter es quizá el sistema más sencillo, simplemente entras en la <a
href="https://twitter.com/settings/applications">gestión de Apps</a> y allí puedes revocar el acceso a las aplicaciones que no te interesen.</p><p><strong>Google</strong>:</p><p>Siempre Google es de los que lo tienen más escondido para llegar, pero se puede acceder de forma directa en <a
href="https://accounts.google.com/b/0/IssuedAuthSubTokens?hl=es">Acceso autorizado a tu Cuenta de Google</a>. Aquí te aparece una lista de las aplicaciones que tienen acceso, qué tipo de acceso y la opción de revocarlo.</p><p><strong>Linkedin</strong>:</p><p>Tienes en las opciones de Linkedin la posisibilidad de añadir aplicaciones propias y de <a
href="https://www.linkedin.com/secure/settings?userAgree=">gestionar las propias y externas</a>. Aquí simplemente tendrás un listado con el nombre de las aplicaciones y un botón para eliminar el acceso, sin más explicaciones.</p><p>Con esto podrás mantener al día tus cuentas y tu información privada, que últimamente estamos dejando repartir por el mundo sin ton ni son, y no creo que sea lo mejor que podemos hacer&#8230;</p>
]]></content:encoded>
<wfw:commentRss>http://javiercasares.com/blog/permisos-redes-sociales/feed/</wfw:commentRss>
<slash:comments>8</slash:comments>
</item>
<item><title>Al fin SOLO con Goyo Jiménez</title><link>http://javiercasares.com/blog/al-fin-solo-con-goyo-jimenez/</link>
<comments>http://javiercasares.com/blog/al-fin-solo-con-goyo-jimenez/#comments</comments>
<pubDate>Sat, 18 Feb 2012 09:52:01 +0000</pubDate>
<dc:creator>Javier Casares</dc:creator>
<category><![CDATA[Barcelona]]></category>
<category><![CDATA[Teatro]]></category>
<guid
isPermaLink="false">http://javiercasares.com/?p=3664</guid>
<description><![CDATA[Silencio, sonrisa, risa, carcajada, aplauso y lágrimas. Tras eso, un dolor de mandíbula y de cara en general por haber ejercitado los músculos más de lo habitual. Ese es el in crescendo cuando vas a ver a Goyo Jiménez ahora &#8230; <a
href="http://javiercasares.com/blog/al-fin-solo-con-goyo-jimenez/">Sigue leyendo <span
class="meta-nav">&#8594;</span></a>]]></description>
<content:encoded><![CDATA[<p>Silencio, sonrisa, risa, carcajada, aplauso y lágrimas. Tras eso, un dolor de mandíbula y de cara en general por haber ejercitado los músculos más de lo habitual. Ese es el <em>in crescendo</em> cuando vas a ver a <a
href="https://twitter.com/#!/Goyojimenez">Goyo Jiménez</a> ahora que &#8220;se ha quedado sólo&#8221; porque su <em>ex</em> lo ha dejado. Y es que en este monólogo de dos horas de duración <strong>no puedes dejar de reírte, aunque él lo intenta</strong>.</p><p>Y digo lo de las dos horas porque en teoría es lo que dura el espectáculo&#8230; ya que el día que fui yo se puso a improvisar la primera hora y, en vez de 55 minutos hizo hora y cuarto&#8230; así que nos llevamos <a
href="https://twitter.com/#!/Goyojimenez/status/170259937467961344">20 minutos por la <em>face</em></a>.</p><p>Para haceros una idea, como la mayoría de los monólogos, todo son tópicos, y la verdad es que esa es la gracia&#8230; que te ves reflejado al 100%. Además, le da por comparar las relaciones y la vida de la pareja y la persona con la informática y, claro, eso a mi me llega al fondo. Que si USB, que si WiFi; además lo deja claro: <strong>los hombres somos PC y las mujeres son Mac</strong>. Aunque comenzar la actuación preguntando cuánta gente tiene twitter (un 20%) y cuánta gente tiene Facebook (un 90%) y cuánta tiene Tuenti (un 0%, declarado) mola.</p><p>El espectáculo se divide  en dos partes&#8230; la primera está más enfocada a destapar los trapos sucios de los hombres&#8230; y cómo la evolución nos ha dejado bajo el manto de las mujeres. La segunda parte es la que desvela cómo son las mujeres, porqué actúan como actúan, una serie de trucos para que aprendamos. Además, seguro que sales con bastantes recomendaciones&#8230; una de ellas es la de ver &#8220;el Encantador de Perros&#8221; con César Millán&#8230;</p><p>Aunque sin duda, si Goyo está haciendo esta obra de teatro, o monólogo o como queráis llamarlo, es porque está buscando, de nuevo a su nueva media naranja (que sabios son los griegos). Así que, sobre todo si vas con tu pareja, ten cuidado que a lo mejor te la levanta. Más que recomendable.</p><p>NOTA: para entender algunas incongruencias de esta entrada, por favor, vé a ver la obra y luego relees que lo verás todo más claro.</p>
]]></content:encoded>
<wfw:commentRss>http://javiercasares.com/blog/al-fin-solo-con-goyo-jimenez/feed/</wfw:commentRss>
<slash:comments>4</slash:comments>
</item>
<item><title>I Master SEO Profesional (Madrid 2012)</title><link>http://javiercasares.com/blog/i-master-seo-profesional/</link>
<comments>http://javiercasares.com/blog/i-master-seo-profesional/#comments</comments>
<pubDate>Tue, 14 Feb 2012 09:22:07 +0000</pubDate>
<dc:creator>Javier Casares</dc:creator>
<category><![CDATA[Madrid]]></category>
<category><![CDATA[Mis Cosas]]></category>
<category><![CDATA[Search Engine Optimization]]></category>
<guid
isPermaLink="false">http://javiercasares.com/?p=3661</guid>
<description><![CDATA[En unas semanas comienza el I Master SEO Profesional que dirige Miguel López (TallerSEO) y que se celebrará en Madrid. A diferencia de otros cursos y formación, este está enfocado al 100% a todo lo que tiene que ver con &#8230; <a
href="http://javiercasares.com/blog/i-master-seo-profesional/">Sigue leyendo <span
class="meta-nav">&#8594;</span></a>]]></description>
<content:encoded><![CDATA[<p>En unas semanas comienza el <a
href="http://kschool.com/seo/cursos/master-SEO-profesional/?utm_campaign=KSMSEO&#038;utm_source=JavierCasares&#038;utm_content=10_Dto_Generico&#038;utm_medium=blog-post">I Master SEO Profesional</a> que dirige <a
href="https://twitter.com/#!/tallerseo">Miguel López (TallerSEO)</a> y que se celebrará en Madrid. A diferencia de otros cursos y formación, este está enfocado al 100% a todo lo que tiene que ver con optimización de sitios, además de todo lo que hay alrededor de ello.</p><p>No sé si puedo decirlo o no, pero os voy a adelantar algunos de los ponentes y algunos de los temas que se tratarán. Por ejemplo <a
href="https://twitter.com/#!/kicoes">Miguel Pascual</a> explicará las distintas fases de un proyecto, <a
href="https://twitter.com/#!/jbmoreno">José Moreno</a> hablará, entre otras cosas de reputación digital, <a
href="https://twitter.com/#!/edgar_sanchez">Edgar Sánchez</a> nos dará algunas herramientas, <a
href="https://twitter.com/#!/aleyda">Aleyda Solis</a> tratará los entresijos para conseguir enlaces, <a
href="https://twitter.com/#!/senormunoz">Fernando Muñoz</a> acabará con auditorías SEO.</p><p>Por mi parte trataré temas más técnicos y hablaré un poco de <a
href="http://javiercasares.com/wpo/" title="Guía WPO">WPO</a>, que como muchos ya sabréis cada vez más está tomando fuerza todo lo que tiene que ver con la infraestructura y velocidad de carga de los sitios. A parte de hablar sobre los elementos básicos, también intentaré entrar en profundidad en cómo montar una infraestructura buena, bonita y barata tan potente como lo que &#8220;los grandes&#8221; montan, con la diferencia de que lo que yo explicaré ayuda al SEO y lo de los grandes no.</p><p>Además, todos los alumnos del master estarán invitados a asistir al <a
href="http://www.congresoseoprofesional.com/">III Congreso SEO Profesional</a> que este año se hace en Madrid también a principios de Julio y donde todos los profesores del master estarán también.</p><p>Así que ya sabes, si te estás planteando ser SEO y dedicarte de forma profesional a ello apúntate al <a
href="http://kschool.com/seo/cursos/master-SEO-profesional/?utm_campaign=KSMSEO&#038;utm_source=JavierCasares&#038;utm_content=10_Dto_Generico&#038;utm_medium=blog-post">I Master SEO Profesional</a>.</p>
]]></content:encoded>
<wfw:commentRss>http://javiercasares.com/blog/i-master-seo-profesional/feed/</wfw:commentRss>
<slash:comments>8</slash:comments>
</item>
</channel>
</rss>
<!-- Dynamic Page Served (once) in 0.634 seconds -->
<!-- Cached page served by WP-Cache -->

