Python反反爬虫,爬虫社区

北京金融局摸排区内大数据公司爬虫业务,那么是爬虫业务?

Python反反爬虫,爬虫社区


爬虫业务易产生隐患,收集个人信息应按法律规定 。进入9月以来,中国的大数据行业似乎进入了一个前所未有的“整顿期”,据多家媒体报道,已有多家第三方大数据公司被纳入调查行列 。“近来,客户越来越重视隐私保护和数据获取的合规性了,对照半年前,差距真的很大 。”陈小阳(化名)是一位律师,大数据公司曾是她的主要客户,这是她近期最直接的感受 。
【Python反反爬虫,爬虫社区】据采访人员了解,对于一般的大数据公司,数据获取来源主要分为三种:第三方机构授权、关联方或场景的数据以及爬虫业务 。而关于数据爬取,理论上是有“红线”的,即要求在遵循一定协议和规则下,大数据公司才能实现自动获取网站站点的信息和数据 。但现实中,规则往往被忽略或简化,个人信息隐私保护的问题,在大数据公司的发展过程中,被凸显出来 。

    推荐阅读