爬行动物获取数据违法吗？数据可以商业化吗？有没有懂的大神？

网络爬虫涉及的法律问题可以从信息层、策略层和数据层进行分析。在信息层，当带有版权和个人信息的内容被抓取时，可能会侵犯知识产权、人格权等法律法规；在战略层面，当爬虫技术涉及突破和绕过反爬虫策略和协议时，可能犯提供工具入侵和非法控制计算机信息系统罪或破坏计算机信息系统罪；在数据层，当爬虫活动的相关行为涉及破解客户端、加密算法等。，可能犯非法获取计算机信息系统数据罪。

一般爬虫界有一个默认协议，Robots协议(也称爬虫协议、机器人协议等。)，全名是RobotsExclusionProtocol。一般网站通过Robots协议告诉搜索引擎哪些页面可以抓取，哪些页面不可以抓取。它是网络资源提供商和搜索引擎之间的一种伦理协议。

机器人协议的实施主要取决于一个文件:

机器人. txt，

网站会把文件放在根目录下。比如爬虫访问一个网站(比如文件/x.y.z/robots.txt)，如果爬虫找到这个文件，就会根据这个文件的内容确定其访问权限的范围。但如上所述，协议只是一个“道德协议”，没有法律保障。不确定遵循这一协议就能避免开头提到的法律问题。

所以我建议使用爬虫做商业用途的朋友，首先要明确数据的性质，是公开数据、半公开数据还是内部系统数据，严禁侵入内部系统数据；避免获取个人信息，明确版权作品、商业秘密等。抓取数据时；限制数据的应用场景，在出现侵害他人商业利益和竞争秩序的场景时，三思而后行。

最后说说如何避免踩雷。第一，最好不要爬同行业竞争对手的数据，官司容易牵扯进去；第二，不要爬公司定性为有商业价值的数据。有一个案例，百度爬上了美团的有价值数据，被告很惨。第三，爬行机器人不得干扰对方的正常操作。如果它崩溃了别人的网站，后果会很严重。

法律参考:

刑法第二百八十五条，非法获取计算机信息系统数据罪。最高刑罚是七年监禁。

刑法第286条，破坏计算机信息系统罪。最高点超过五年。比如为了抓取数据，破解登录密码，反编译APP。

网络安全法，倒卖私人数据链条中的一环。你把捕捉到的数据卖给坏人，坏人用这些数据做坏事。你是其中之一。