【AI创业中使用开源AI、数据爬取,有哪些风险?|AI合规圈下午茶精华】萍聚社区-德国热线-德国实用信息网人工智能

多客科技 发表于 2025-5-30 17:29

AI创业中使用开源AI、数据爬取,有哪些风险?|AI合规圈下午茶精华

作者：微信文章

请加「星标」不错过我们的消息

5月29日，「AI合规圈下午茶」第一期活动在北京市隆安（广州）律师事务所举办，十余位AI产业相关人士共聚一堂，展开了一场以“开源AI与数据爬取”为核心的探讨。

当法律与产业实践相互碰撞，最真实的需求与痛点才能相继浮现。参会者分享了各自的工作经验和看法，我们也做出相应总结同大家分享，希望能够继续激荡起更多思考。

1

开源AI背后的风险？

如何定义开源AI？在以OSD为代表的传统开源标准中，主要是针对“源代码”层面提出要求，但当前的AI除了源代码之外，还包括大量的数据信息以及模型参数，传统的开源代码和许可证的观点不足以保证使用、研究、共享和修改系统的自由。因此，OSI提出了《The Open Source AI Definition-1.0》、LF AI&Data基金会提出了模型开放框架（MOF）重新定义开源AI。尽管如此，由于该规定下的开源范围过于广泛，导致实际应用很少，未来很难推广。

开源=自由or没有风险？首先，用户在使用开源AI时仍然需要关注许可证，以及许可证中具体规定了哪些条款。比如，是否可以商用？是否需要保留原作者版权声明？一旦违反相应的内容，都有可能构成违约或者侵权。其次，开源项目也可能被用于违法、犯罪目的。在这种情况之下很有可能会被认定构成《刑法》第二百八十五条第三款，提供侵入、非法控制计算机信息系统程序、工具罪，这也提示了开发人员应当树立警戒意识。

2

从实践角度出发，开源趋势之下AI企业应当重点关注哪些核心问题？

AI高速裂变的背景之下，开源成为趋势，因而对于企业而言，数据才是其实现长久发展的真正的“护城河”。

从AI起步至今的实践来看，一是企业项目面临合规与技术双重阻力，比如“数据怎么来？”“数据怎么用？”；二是企业如何抢占发展生态位，大厂的实践可以为中小企业提供借鉴；三是政策影响下，国内AI项目落地往往依赖 “由上至下”的政策推动，企业需要动态适配这样的节奏，才能在不同的场景中寻找到差异化机会；四是技术场景的落地受到“可解释性”的阻力，大模型辅助决策这种操作虽然技术上不存在太多困难，应用上也比较常见，但是由于缺乏逻辑透明度导致难以获得企业高层的信任，也就无法实现真正的场景落地。可解释性的本身就是产品，如何实现这一标准，需要企业重点关注。

3

目前AI 创业过程中，有哪些合规上的风险？

爬取来的数据是否合规尚且没有统一的定论。举例而言，法律AI依赖的裁判文书库、法律法规数据库等，虽可通过公开渠道获取或购买，但实际操作中很多平台都采用“爬取”这一形式。这么做到底可不可以？我们很难从法律法规中找到依据。实践中，直接爬取裁判文书网数据虽未被明确禁止，但部分客户可能对数据来源的合法性非常敏感，基于此，我们如何证明“爬取来的数据是合规的呢”？行业普遍存在这样的困惑，且监管层对爬虫数据的持有权、使用权尚未出台明确标准，导致合规边界模糊，也让大家的头顶始终悬挂着一把“达摩克利斯之剑”。

政策滞后引发一系列企业行为是否合规的不确定性风险。除了前文提到的来源合规问题之外，国内对AI的监管规则普遍滞后于技术发展，存在“野蛮生长” 阶段的合规隐患。比如早期智能体创业因为政策导向不明确而难以推进，数字人侵权、未经授权生成明星形象等问题频发，技术上虽然可以规避这些风险，但由于政策、法律法规并没有明确的规范，企业为了利益也打起了“擦边球”。显然，随着相关国标、政策的逐步落地与完善，企业之前的“不合规操作”也面临着必须调整的局面，而中小企业因为缺乏政策敏感度和合规资源，很有可能成为监管收紧后的高风险主体。

关于「AI合规圈下午茶」

「AI合规圈下午茶」是「AI合规圈」发起的线下交流系列活动。

「AI合规圈」将持续以线下沙龙、公众号、视频号等方式，关注AI的最新资讯、新鲜玩法、对接产业资源、依托合规阵地，把握AI产业蓝海，远离AI行业红线，帮助AI从业者/AI创业者了解前沿AI资讯、结识优质人脉圈、把控法律风险，让AI企业、AI从业者在人工智能时代获得更多的机会与安全感。

请加「星标」不错过我们的消息

目录

第一章入门篇

法律人使用AI的12大核心技能

一、起步指南：快速使用DeepSeek的步骤

二、了解提示词：让AI听懂你的话

三、定身份：让AI“入戏”

四、讲背景：让AI真的懂你

五、提要求：让AI行动起来

六、结构输出法：让AI“按规矩办事”

七、样本示范法：给AI“参考答案”

八、任务分解法：复杂任务化整为零

九、提问迭代术：与AI的“深度对话”

十、模型对比法：AI“专家会诊”

十一、风险把控：筑牢风险防火墙

十二、价值锚定：树立正确的AI价值观

第二章基础篇

法律人使用DeepSeek的21大应用场景

一、法律人使用DeepSeek独门心法

二、辅助撰写类案检索报告

三、辅助撰写案件汇报提纲

四、辅助撰写调研报告及检察（司法）建议

五、辅助分析侦查（调查）数据

六、辅助撰写侦查（调查）方案

七、辅助对犯罪嫌疑人画像

八、辅助制作侦查（调查）讯问笔录提纲

九、辅助撰写审查报告

十、辅助量刑测算

十一、辅助撰写起诉书

十二、辅助撰写庭审讯问、询问提纲

十三、辅助撰写公诉意见书

十四、辅助撰写不起诉决定书、不起诉理由说明书

十五、辅助撰写刑事抗诉书

十六、辅助撰写刑事会见提纲

十七、辅助撰写质证意见

十八、辅助撰写辩护发问提纲

十九、辅助撰写辩护词

二十、辅助撰写审理报告

二十一、辅助撰写裁判文书

二十二、辅助撰写民事调解书

第三章进阶篇

法律垂类AI工具的20件法宝

一、法律检索：以秘塔AI搜索、微信AI搜索为例

二、合同审查：以案牍×法天使智能合同审查系统为例

三、合同管理：以飞书多维表格为例

四、整理视听证据：以通义听悟为例

五、模拟法庭实训：以北大法宝模拟法庭为例

六、法律文书写作：以AlphaGPT为例

七、法律翻译：以智谱清言、腾讯会议、沉浸式翻译、DeepL为例

八、阅读法律材料：以豆包浏览器插件为例

九、撰写公文：以DeepSeek、新华妙笔、WPS AI为例

十、知识管理：以Get笔记、ima、“律AI多”为例

十一、实现文本可视化：以Mermaid为例

十二、实现多端协作：以微信AI输入法为例

第四章腾飞篇

法律人使用AI加持IP的10大战法

一、书课视频一体化打造法律人IP的基本方法

二、用AI起书名

三、用AI整理书稿目录或授课框架

四、用AI辅助写作

五、用AI快速制作PPT课件

六、用AI为视频号选题

七、用AI快速生成短视频文案

八、用AI快速剪辑短视频

九、用数字人提升视频号效率

十、用AI提升网络曝光率

第五章高阶篇

法律人的两大AI终极武器：智能体与本地化部署

一、Manus的崛起：AI智能体颠覆传统法律工作

二、零代码实战：30分钟打造你的“免费法律咨询助手”

三、开庭管理革命：DeepSeek+飞书实现“一键无忧”

四、团队任务自动化：DeepSeek+飞书高效管理团队任务

五、本地化部署：数据安全的核心方案

六、极简三步走：手把手教你部署本地化模型

七、君子务本：AI浪潮中法律人的价值锚点

附录

一、AI产品简介

二、法律AI产品简介

三、法律人必备AI资料包

后记

-- 下滑查看更多 --

● 即将人手一个的网号，是什么？
● AI创业者｜豆包视频通话的合规经验，应该怎么抄？● 网信办公布算法合规正确答案，是时候抄作业了｜AI创业者

页: [1]

萍聚社区-德国热线-德国实用信息网's Archiver

AI创业中使用开源AI、数据爬取,有哪些风险?|AI合规圈下午茶精华