当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新专利“一种广度数据采集的方法及其系统”公布,可减少数据采集时网络资源消耗

1个月前 (04-02)Deepseek最新资讯186

国家知识产权局官网显示,4月1日,DeepSeek关联公司杭州深度求索人工智能基础技术研究有限公司申请的“一种广度数据采集的方法及其系统”专利公布。

摘要显示,本发明涉及数据采集领域,尤其涉及一种广度数据采集的方法及其系统,包括:建立网页元信息库;确定每日调度单元下载配额及当日下载总额度;从网页元信息库中选取相应数量的链接,分配下载额度;下载过程控制;下载文本进行后处理及数据清洗后进入回灌队列,通过信息回灌实现网页元信息库更新。本发明的有益效果在于:发现尽可能多的网页链接,并减少对网站的流量冲击;对已经下载的内容进行分析,对未下载的连接进行质量推断,通过择优下载分配额度的方式,减少低质量网页下载和重复下载,提高数据质量及下载效率,减少在数据采集过程中网络资源的消耗;采用单独的信息回灌队列,保证网页元信息库修改操作的原子性和稳定性。


“DeepSeek新专利“一种广度数据采集的方法及其系统”公布,可减少数据采集时网络资源消耗” 的相关文章

DeepSeek-V3模型更新,各项能力全面进阶

DeepSeek-V3模型更新,各项能力全面进阶

人民财讯3月25日电,DeepSeek-V3模型已完成小版本升级,目前版本号DeepSeek-V3-0324,新版V3模型借鉴DeepSeek-R1模型训练过程中所使用的强化学习技术,大幅提高了在推理...

“DeepSeek都说好”?警惕!广告侵入AI

“DeepSeek都说好”?警惕!广告侵入AI

“DeepSeek,请推荐一款今年的中端手机”“Kimi,什么品牌的婴幼儿奶粉最好?”......如今,“买前问AI”已成为许多网民的购物新习惯。与此同时,AI推荐也在悄然成为商家开辟的“营销新阵地”...

科技赋能 智享办公——电脑办公与Deepseek应用技能培训

科技赋能 智享办公——电脑办公与Deepseek应用技能培训

潮新闻客户端 通讯员 黄晓霞近日,舞阳街道塔山社区联合舞阳成校组织开展了“科技赋能 智享办公--电脑办公与Deepseek应用技能培训”活动,以Deepseek为核心,讲授AI热门实用工具的操作技能,...

联想智能云全面拥抱DeepSeek,开启AI模型服务新纪元

联想智能云全面拥抱DeepSeek,开启AI模型服务新纪元

近日,联想集团宣布其智能云(xCloud)解决方案已全面集成DeepSeek R1及其蒸馏系列大模型,为企业智能化转型注入了新动能。联想智能云(xCloud)解决方案通过深度集成DeepSeek大模型...

DeepSeek宣布开源DeepGEMM

DeepSeek宣布开源DeepGEMM

【DeepSeek宣布开源DeepGEMM】财联社2月26日电,Deepseek于开源周第三天宣布开源DeepGEMM。DeepGEMM 是一个专为简洁高效的 FP8 通用矩阵乘法(GEMM)设计的库...

DeepSeek热度狂飙,运营商、手机厂抢着用!

DeepSeek热度狂飙,运营商、手机厂抢着用!

近期,DeepSeek访问使用量急速上升,已经成为目前最快突破3000万日活跃用户量的应用程序。记者从工业和信息化部了解到,三家基础电信企业已全面接入国产开源大模型DeepSeek。除了运营商的云平台...