Vídeo: Marta Peirano and Peter Pomerantsev. Tecnología, vigilancia digital y desinformación (De novembre 2024)
Digueu que sou un proveïdor en línia d’electrònica usada. La vostra empresa depèn d'aquest tipus que desitgi un iPad usat per trobar els millors preus. Però no estaríeu tan feliços si un competidor captés tota la vostra llista de preus per superar els preus. Com podeu permetre l’accés complet als usuaris tot impedint el rastreig a l’engròs del contingut? Bé, podríeu utilitzar ScrapeDefender, una solució anti-rascades basada en núvol que es va publicar avui. Vaig parlar amb Robert Kane, director general de ScrapeDefender, sobre el funcionament del producte.
Qui ho necessita?
"Ja estem treballant amb companyies aèries, electrònica de consum, mercats financers i molt més com a clients beta", va dir Kane. "Qualsevol lloc web que publiqui molt contingut important, llistes de preus, béns immobles… Tot aquest contingut es pot recollir massivament". Kane va assenyalar que, mentre que alguns rascadors utilitzen scripts simples, d’altres intenten enmascarar com a humans capturant el lloc més lentament o utilitzant múltiples robots. "El repte per als propietaris és, com puc deixar que el món entri i evitar els bots no autoritzats", va concloure Kane.
És aquí on entra ScrapeDefender. "El nostre monitor és una eina passiva, com Google Analytics", va dir Kane. "Inseriu una línia de codi al vostre lloc que ens permet monitoritzar-la 24 hores / 24. Només una línia de codi a la capçalera de la pàgina web. Com que és passiu, no hi ha cap efecte sobre la vostra xarxa de producció."
Tauler de comandament en línia
Un client de ScrapeDefender pot veure una visió general de totes les activitats de rascades bloquejades, però també pot cavar en profunditat per obtenir més informació. Kane va demostrar el sistema, mostrant-me el tipus d’activitats que aixequen una bandera vermella. Moltes són molt senzilles. L’adreça IP d’un rascador tendeix a fer molt més visites al lloc i visites de pàgines que no pas a una persona humana i tendeix a romandre en qualsevol pàgina durant molt poc temps. Fins i tot quan intenten anar lents i evitar la detecció, un patró és visible. Les visites dels humans solen venir amb un camp de referència; les visites rascant bots mai no ho fan. Tots aquests criteris contribueixen a una puntuació global del risc; una puntuació prou alta identifica gairebé sempre l'activitat de rascades.
"Els rascadors sofisticats utilitzen diverses adreces IP", va assenyalar Kane. "Però utilitzem una empremta digital per coincidir amb sessions relacionades, fins i tot quan la IP és diferent. Pot ser un script que es publiqui en diferents màquines o diferents màquines virtuals, però l'empremta digital és el mateix.
Raspador, sense rascades!
Vaig preguntar què passa un cop identificat un rascador. "Ho fem de dues maneres", va dir Kane. "Oferim un mòdul de seguretat que pot fer el bloqueig per ells, però estem descobrint que les organitzacions amb les quals treballem tenen el seu tallafoc al seu lloc. Així, tenim una API que pot enviar les adreces IP sospitoses al seu tallafoc."
Aleshores, què costa? El preu comença a partir de 79 dòlars al mes i augmenta el lloc web de qualsevol mida. "Algú va contactar amb nosaltres la setmana passada", va dir Kane, "sobre un lloc web amb 25 milions de visualitzacions de pàgines… al dia ! Ho donem suport."
La companyia executarà una exploració sobre unes 150 vulnerabilitats relacionades amb els rascadures per a un nou client, però qualsevol pot executar una exploració gratuïta que verifiqui un subconjunt d'aquests. Només cal visitar el lloc web de ScrapeDefender i introduir el nom de domini. En pocs minuts, tindreu la vostra resposta.
El futur
"Segons la meva opinió", va dir Kane, "ara no es pot analitzar ressenyes similars a les primeres empreses antivirus. És una oportunitat enorme. Tothom haurà de tenir-ho". Va assenyalar que Snapchat podria haver utilitzat aquesta tecnologia per evitar la recol·lecció de 4, 6 milions de dades d’usuaris i per tant afrontar la recent expansió del correu brossa de Snapchat.
"CAPTCHA no és una solució", va dir Kane. "Encara que hagi funcionat, no han sentit a parlar de les granges CAPTCHA? La veritable solució és mirar el comportament i bloquejar els comportaments de rascades".
Queda per comprovar si prou propietaris de llocs web optaran per pagar una solució antitreball. Vaig a veure com es veu aquest.