AI创业中使用开源AI、数据爬取,有哪些风险?|AI合规圈下午茶精华
作者:微信文章请加「星标」不错过我们的消息
5月29日,「AI合规圈下午茶」第一期活动在北京市隆安(广州)律师事务所举办,十余位AI产业相关人士共聚一堂,展开了一场以“开源AI与数据爬取”为核心的探讨。
当法律与产业实践相互碰撞,最真实的需求与痛点才能相继浮现。参会者分享了各自的工作经验和看法,我们也做出相应总结同大家分享,希望能够继续激荡起更多思考。
1
开源AI背后的风险?
如何定义开源AI?在以OSD为代表的传统开源标准中,主要是针对“源代码”层面提出要求,但当前的AI除了源代码之外,还包括大量的数据信息以及模型参数,传统的开源代码和许可证的观点不足以保证使用、研究、共享和修改系统的自由。因此,OSI提出了《The Open Source AI Definition-1.0》、LF AI&Data基金会提出了模型开放框架(MOF)重新定义开源AI。尽管如此,由于该规定下的开源范围过于广泛,导致实际应用很少,未来很难推广。
开源=自由or没有风险?首先,用户在使用开源AI时仍然需要关注许可证,以及许可证中具体规定了哪些条款。比如,是否可以商用?是否需要保留原作者版权声明?一旦违反相应的内容,都有可能构成违约或者侵权。其次,开源项目也可能被用于违法、犯罪目的。在这种情况之下很有可能会被认定构成《刑法》第二百八十五条第三款,提供侵入、非法控制计算机信息系统程序、工具罪,这也提示了开发人员应当树立警戒意识。
2
从实践角度出发,开源趋势之下AI企业应当重点关注哪些核心问题?
AI高速裂变的背景之下,开源成为趋势,因而对于企业而言,数据才是其实现长久发展的真正的“护城河”。
从AI起步至今的实践来看,一是企业项目面临合规与技术双重阻力,比如“数据怎么来?”“数据怎么用?”;二是企业如何抢占发展生态位,大厂的实践可以为中小企业提供借鉴;三是政策影响下,国内AI项目落地往往依赖 “由上至下”的政策推动,企业需要动态适配这样的节奏,才能在不同的场景中寻找到差异化机会;四是技术场景的落地受到“可解释性”的阻力,大模型辅助决策这种操作虽然技术上不存在太多困难,应用上也比较常见,但是由于缺乏逻辑透明度导致难以获得企业高层的信任,也就无法实现真正的场景落地。可解释性的本身就是产品,如何实现这一标准,需要企业重点关注。
3
目前AI 创业过程中,有哪些合规上的风险?
爬取来的数据是否合规尚且没有统一的定论。举例而言,法律AI依赖的裁判文书库、法律法规数据库等,虽可通过公开渠道获取或购买,但实际操作中很多平台都采用“爬取”这一形式。这么做到底可不可以?我们很难从法律法规中找到依据。实践中,直接爬取裁判文书网数据虽未被明确禁止,但部分客户可能对数据来源的合法性非常敏感,基于此,我们如何证明“爬取来的数据是合规的呢”?行业普遍存在这样的困惑,且监管层对爬虫数据的持有权、使用权尚未出台明确标准,导致合规边界模糊,也让大家的头顶始终悬挂着一把“达摩克利斯之剑”。
政策滞后引发一系列企业行为是否合规的不确定性风险。除了前文提到的来源合规问题之外,国内对AI的监管规则普遍滞后于技术发展,存在“野蛮生长” 阶段的合规隐患。比如早期智能体创业因为政策导向不明确而难以推进,数字人侵权、未经授权生成明星形象等问题频发,技术上虽然可以规避这些风险,但由于政策、法律法规并没有明确的规范,企业为了利益也打起了“擦边球”。显然,随着相关国标、政策的逐步落地与完善,企业之前的“不合规操作”也面临着必须调整的局面,而中小企业因为缺乏政策敏感度和合规资源,很有可能成为监管收紧后的高风险主体。
关于「AI合规圈下午茶」
「AI合规圈下午茶」是「AI合规圈」发起的线下交流系列活动。
「AI合规圈」将持续以线下沙龙、公众号、视频号等方式,关注AI的最新资讯、新鲜玩法、对接产业资源、依托合规阵地,把握AI产业蓝海,远离AI行业红线,帮助AI从业者/AI创业者了解前沿AI资讯、结识优质人脉圈、把控法律风险,让AI企业、AI从业者在人工智能时代获得更多的机会与安全感。
请加「星标」不错过我们的消息
目录
第一章 入门篇
法律人使用AI的12大核心技能
一、起步指南:快速使用DeepSeek的步骤
二、了解提示词:让AI听懂你的话
三、定身份:让AI“入戏”
四、讲背景:让AI真的懂你
五、提要求:让AI行动起来
六、结构输出法:让AI“按规矩办事”
七、样本示范法:给AI“参考答案”
八、任务分解法:复杂任务化整为零
九、提问迭代术:与AI的“深度对话”
十、模型对比法:AI“专家会诊”
十一、风险把控:筑牢风险防火墙
十二、价值锚定:树立正确的AI价值观
第二章 基础篇
法律人使用DeepSeek的21大应用场景
一、法律人使用DeepSeek独门心法
二、辅助撰写类案检索报告
三、辅助撰写案件汇报提纲
四、辅助撰写调研报告及检察(司法)建议
五、辅助分析侦查(调查)数据
六、辅助撰写侦查(调查)方案
七、辅助对犯罪嫌疑人画像
八、辅助制作侦查(调查)讯问笔录提纲
九、辅助撰写审查报告
十、辅助量刑测算
十一、辅助撰写起诉书
十二、辅助撰写庭审讯问、询问提纲
十三、辅助撰写公诉意见书
十四、辅助撰写不起诉决定书、不起诉理由说明书
十五、辅助撰写刑事抗诉书
十六、辅助撰写刑事会见提纲
十七、辅助撰写质证意见
十八、辅助撰写辩护发问提纲
十九、辅助撰写辩护词
二十、辅助撰写审理报告
二十一、辅助撰写裁判文书
二十二、辅助撰写民事调解书
第三章 进阶篇
法律垂类AI工具的20件法宝
一、法律检索:以秘塔AI搜索、微信AI搜索为例
二、合同审查:以案牍×法天使智能合同审查系统为例
三、合同管理:以飞书多维表格为例
四、整理视听证据:以通义听悟为例
五、模拟法庭实训:以北大法宝模拟法庭为例
六、法律文书写作:以AlphaGPT为例
七、法律翻译:以智谱清言、腾讯会议、沉浸式翻译、DeepL为例
八、阅读法律材料:以豆包浏览器插件为例
九、撰写公文:以DeepSeek、新华妙笔、WPS AI为例
十、知识管理:以Get笔记、ima、“律AI多”为例
十一、实现文本可视化:以Mermaid为例
十二、实现多端协作:以微信AI输入法为例
第四章 腾飞篇
法律人使用AI加持IP的10大战法
一、书课视频一体化打造法律人IP的基本方法
二、用AI起书名
三、用AI整理书稿目录或授课框架
四、用AI辅助写作
五、用AI快速制作PPT课件
六、用AI为视频号选题
七、用AI快速生成短视频文案
八、用AI快速剪辑短视频
九、用数字人提升视频号效率
十、用AI提升网络曝光率
第五章 高阶篇
法律人的两大AI终极武器:智能体与本地化部署
一、Manus的崛起:AI智能体颠覆传统法律工作
二、零代码实战:30分钟打造你的“免费法律咨询助手”
三、开庭管理革命:DeepSeek+飞书实现“一键无忧”
四、团队任务自动化:DeepSeek+飞书高效管理团队任务
五、本地化部署:数据安全的核心方案
六、极简三步走:手把手教你部署本地化模型
七、君子务本:AI浪潮中法律人的价值锚点
附录
一、AI产品简介
二、法律AI产品简介
三、法律人必备AI资料包
后记
-- 下滑查看更多 --
● 即将人手一个的网号,是什么?
● AI创业者|豆包视频通话的合规经验,应该怎么抄?● 网信办公布算法合规正确答案,是时候抄作业了|AI创业者
页:
[1]