多客科技 发表于 2025-5-30 17:29

AI创业中使用开源AI、数据爬取,有哪些风险?|AI合规圈下午茶精华

作者:微信文章

请加「星标」不错过我们的消息


5月29日,「AI合规圈下午茶」第一期活动在北京市隆安(广州)律师事务所举办,十余位AI产业相关人士共聚一堂,展开了一场以“开源AI与数据爬取”为核心的探讨。

当法律与产业实践相互碰撞,最真实的需求与痛点才能相继浮现。参会者分享了各自的工作经验和看法,我们也做出相应总结同大家分享,希望能够继续激荡起更多思考。

1

开源AI背后的风险?

如何定义开源AI?在以OSD为代表的传统开源标准中,主要是针对“源代码”层面提出要求,但当前的AI除了源代码之外,还包括大量的数据信息以及模型参数,传统的开源代码和许可证的观点不足以保证使用、研究、共享和修改系统的自由。因此,OSI提出了《The Open Source AI Definition-1.0》、LF AI&Data基金会提出了模型开放框架(MOF)重新定义开源AI。尽管如此,由于该规定下的开源范围过于广泛,导致实际应用很少,未来很难推广。

开源=自由or没有风险?首先,用户在使用开源AI时仍然需要关注许可证,以及许可证中具体规定了哪些条款。比如,是否可以商用?是否需要保留原作者版权声明?一旦违反相应的内容,都有可能构成违约或者侵权。其次,开源项目也可能被用于违法、犯罪目的。在这种情况之下很有可能会被认定构成《刑法》第二百八十五条第三款,提供侵入、非法控制计算机信息系统程序、工具罪,这也提示了开发人员应当树立警戒意识。

2

从实践角度出发,开源趋势之下AI企业应当重点关注哪些核心问题?

AI高速裂变的背景之下,开源成为趋势,因而对于企业而言,数据才是其实现长久发展的真正的“护城河”。

从AI起步至今的实践来看,一是企业项目面临合规与技术双重阻力,比如“数据怎么来?”“数据怎么用?”;二是企业如何抢占发展生态位,大厂的实践可以为中小企业提供借鉴;三是政策影响下,国内AI项目落地往往依赖 “由上至下”的政策推动,企业需要动态适配这样的节奏,才能在不同的场景中寻找到差异化机会;四是技术场景的落地受到“可解释性”的阻力,大模型辅助决策这种操作虽然技术上不存在太多困难,应用上也比较常见,但是由于缺乏逻辑透明度导致难以获得企业高层的信任,也就无法实现真正的场景落地。可解释性的本身就是产品,如何实现这一标准,需要企业重点关注。

3

目前AI 创业过程中,有哪些合规上的风险?

爬取来的数据是否合规尚且没有统一的定论。举例而言,法律AI依赖的裁判文书库、法律法规数据库等,虽可通过公开渠道获取或购买,但实际操作中很多平台都采用“爬取”这一形式。这么做到底可不可以?我们很难从法律法规中找到依据。实践中,直接爬取裁判文书网数据虽未被明确禁止,但部分客户可能对数据来源的合法性非常敏感,基于此,我们如何证明“爬取来的数据是合规的呢”?行业普遍存在这样的困惑,且监管层对爬虫数据的持有权、使用权尚未出台明确标准,导致合规边界模糊,也让大家的头顶始终悬挂着一把“达摩克利斯之剑”。

政策滞后引发一系列企业行为是否合规的不确定性风险。除了前文提到的来源合规问题之外,国内对AI的监管规则普遍滞后于技术发展,存在“野蛮生长” 阶段的合规隐患。比如早期智能体创业因为政策导向不明确而难以推进,数字人侵权、未经授权生成明星形象等问题频发,技术上虽然可以规避这些风险,但由于政策、法律法规并没有明确的规范,企业为了利益也打起了“擦边球”。显然,随着相关国标、政策的逐步落地与完善,企业之前的“不合规操作”也面临着必须调整的局面,而中小企业因为缺乏政策敏感度和合规资源,很有可能成为监管收紧后的高风险主体。



关于「AI合规圈下午茶」

「AI合规圈下午茶」是「AI合规圈」发起的线下交流系列活动。

「AI合规圈」将持续以线下沙龙、公众号、视频号等方式,关注AI的最新资讯、新鲜玩法、对接产业资源、依托合规阵地,把握AI产业蓝海,远离AI行业红线,帮助AI从业者/AI创业者了解前沿AI资讯、结识优质人脉圈、把控法律风险,让AI企业、AI从业者在人工智能时代获得更多的机会与安全感。

请加「星标」不错过我们的消息






目录

第一章 入门篇

法律人使用AI的12大核心技能

一、起步指南:快速使用DeepSeek的步骤

二、了解提示词:让AI听懂你的话

三、定身份:让AI“入戏”

四、讲背景:让AI真的懂你

五、提要求:让AI行动起来

六、结构输出法:让AI“按规矩办事”

七、样本示范法:给AI“参考答案”

八、任务分解法:复杂任务化整为零

九、提问迭代术:与AI的“深度对话”

十、模型对比法:AI“专家会诊”

十一、风险把控:筑牢风险防火墙

十二、价值锚定:树立正确的AI价值观

第二章 基础篇

法律人使用DeepSeek的21大应用场景

一、法律人使用DeepSeek独门心法

二、辅助撰写类案检索报告

三、辅助撰写案件汇报提纲

四、辅助撰写调研报告及检察(司法)建议

五、辅助分析侦查(调查)数据

六、辅助撰写侦查(调查)方案

七、辅助对犯罪嫌疑人画像

八、辅助制作侦查(调查)讯问笔录提纲

九、辅助撰写审查报告

十、辅助量刑测算

十一、辅助撰写起诉书

十二、辅助撰写庭审讯问、询问提纲

十三、辅助撰写公诉意见书

十四、辅助撰写不起诉决定书、不起诉理由说明书

十五、辅助撰写刑事抗诉书

十六、辅助撰写刑事会见提纲

十七、辅助撰写质证意见

十八、辅助撰写辩护发问提纲

十九、辅助撰写辩护词

二十、辅助撰写审理报告

二十一、辅助撰写裁判文书

二十二、辅助撰写民事调解书

第三章 进阶篇

法律垂类AI工具的20件法宝

一、法律检索:以秘塔AI搜索、微信AI搜索为例

二、合同审查:以案牍×法天使智能合同审查系统为例

三、合同管理:以飞书多维表格为例

四、整理视听证据:以通义听悟为例

五、模拟法庭实训:以北大法宝模拟法庭为例

六、法律文书写作:以AlphaGPT为例

七、法律翻译:以智谱清言、腾讯会议、沉浸式翻译、DeepL为例

八、阅读法律材料:以豆包浏览器插件为例

九、撰写公文:以DeepSeek、新华妙笔、WPS AI为例

十、知识管理:以Get笔记、ima、“律AI多”为例

十一、实现文本可视化:以Mermaid为例

十二、实现多端协作:以微信AI输入法为例

第四章 腾飞篇

法律人使用AI加持IP的10大战法

一、书课视频一体化打造法律人IP的基本方法

二、用AI起书名

三、用AI整理书稿目录或授课框架

四、用AI辅助写作

五、用AI快速制作PPT课件

六、用AI为视频号选题

七、用AI快速生成短视频文案

八、用AI快速剪辑短视频

九、用数字人提升视频号效率

十、用AI提升网络曝光率

第五章 高阶篇

法律人的两大AI终极武器:智能体与本地化部署

一、Manus的崛起:AI智能体颠覆传统法律工作

二、零代码实战:30分钟打造你的“免费法律咨询助手”

三、开庭管理革命:DeepSeek+飞书实现“一键无忧”

四、团队任务自动化:DeepSeek+飞书高效管理团队任务

五、本地化部署:数据安全的核心方案

六、极简三步走:手把手教你部署本地化模型

七、君子务本:AI浪潮中法律人的价值锚点

附录

一、AI产品简介

二、法律AI产品简介

三、法律人必备AI资料包

后记

-- 下滑查看更多 --




● 即将人手一个的网号,是什么?
● AI创业者|豆包视频通话的合规经验,应该怎么抄?● 网信办公布算法合规正确答案,是时候抄作业了|AI创业者
页: [1]
查看完整版本: AI创业中使用开源AI、数据爬取,有哪些风险?|AI合规圈下午茶精华