当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新专利“一种广度数据采集的方法及其系统”公布,可减少数据采集时网络资源消耗

3个月前 (04-02)Deepseek最新资讯329

国家知识产权局官网显示,4月1日,DeepSeek关联公司杭州深度求索人工智能基础技术研究有限公司申请的“一种广度数据采集的方法及其系统”专利公布。

摘要显示,本发明涉及数据采集领域,尤其涉及一种广度数据采集的方法及其系统,包括:建立网页元信息库;确定每日调度单元下载配额及当日下载总额度;从网页元信息库中选取相应数量的链接,分配下载额度;下载过程控制;下载文本进行后处理及数据清洗后进入回灌队列,通过信息回灌实现网页元信息库更新。本发明的有益效果在于:发现尽可能多的网页链接,并减少对网站的流量冲击;对已经下载的内容进行分析,对未下载的连接进行质量推断,通过择优下载分配额度的方式,减少低质量网页下载和重复下载,提高数据质量及下载效率,减少在数据采集过程中网络资源的消耗;采用单独的信息回灌队列,保证网页元信息库修改操作的原子性和稳定性。


“DeepSeek新专利“一种广度数据采集的方法及其系统”公布,可减少数据采集时网络资源消耗” 的相关文章

艾美疫苗全面接入DeepSeek大模型

艾美疫苗全面接入DeepSeek大模型

2月23日晚,港股公司艾美疫苗(06660.HK)发布自愿公告,全面部署接入DeepSeek大模型,通过本地化策略,推动DeepSeek-R1版本在集团全业务场景应用,实现疫苗全生命周期的“降本、提质...

梅安森:公司已完成DeepSeek-R1本地化部署

梅安森:公司已完成DeepSeek-R1本地化部署

每经AI快讯,有投资者在投资者互动平台提问:董秘你好!贵司与华为合作的矿山AI大模型有融入和接入deepseek吗?若贵司矿山A I大模型安全融入deepseek后、为公司帶來哪些核心竞争力?謝謝梅安...

公元:DeepSeek只打开一扇门,大模型远没到终局

公元:DeepSeek只打开一扇门,大模型远没到终局

谁会先迈出下一只脚?DeepSeek如何改变中国AI投资?具身智能距离清晰商业化还要多久?这些热门话题吸引了众多资深投资人热烈讨论。在 “第19届中国投资年会·年度峰会”上,投中网主编曹玮钰与红杉中国...

太龙药业:公司目前未与DeepSeek合作

太龙药业:公司目前未与DeepSeek合作

每经AI快讯,有投资者在投资者互动平台提问:请问贵公司是否已经部署了DeepSeek?如果已经部署了,请问主要应用于哪些具体的业务?公司接入DeepSeek有哪些成本、收益方面的考量?如果公司计划在未...

DeepSeek于知乎开设官方账号

DeepSeek于知乎开设官方账号

3月1日,DeepSeek于知乎开设官方账号,发布《DeepSeek-V3/R1推理系统概览》技术文章,首次公布模型推理系统优化细节,并披露成本利润率关键信息。文章写道:“DeepSeek-V3/R1...

DeepSeek写材料提示词100条

DeepSeek写材料提示词100条

DeepSeek写材料提示词100条 1常用模板生成1、生成一份标准的......会议通知模板2、撰写关于......工作的请示报告框架3、创建一份年度工作总结模板(包含成绩、不足、计划)4...