当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新模型颠覆OCR传统,文本转视觉获Karpathy盛赞

19小时前Deepseek最新资讯20

  据新浪科技报道,近日DeepSeek再次新发布并开源的OCR模型,从根本上改变了AI游戏规则。Github开源项目DeepSeek-OCR,一夜收获超4k星。相关论文(《DeepSeek OCR:上下文光学压缩》)解释了这一研究成果。

  传统OCR如同“文字扫描仪”,通过光学技术将图像中的文字提取转换为计算机和人都能理解的格式。比如,在将大量票据、证件、表单等数据电子化时,OCR发挥关键作用。

  但DeepSeek却反其道而行之——将文本信息“绘制”为视觉图像,再通过视觉模型实现高效理解。如此创新尝试就是为了解决大模型的核心痛点——处理长文本时面临的计算挑战deepseek

  10页密密麻麻的文本报告,被压缩成一张图片,AI能够一眼读懂它。这样的信息处理效率意味着大幅降低了计算复杂度,用最直接的方式节约成本。

  最近还在锐评AI发展的OpenAI创始团队成员、特斯拉前AI总监Karpathy,对DeepSeek新成果直言喜爱,并指出“早就该让视觉成为AI核心,而非依赖烂透了的文本分词器。”

  更有业内大佬感叹,“当文本能被转化为视觉可理解的结构,语言与视觉的统一或许不再是理论。这可能是通往 AGI(通用人工智能)的关键一步。

  深度学习模型的记忆以分布式参数形式存储,这种非结构化存储导致传统神经网络在学习新任务时,旧知识的参数空间会被新知识覆盖,模型无法做到像人类一样进行连贯推理。

  而DeepSeek的想法是,通过视觉-文本压缩范式和动态分层遗忘机制,让AI“记住该记住的,忘记该忘记的”。

  其核心思路是将文本信息转化为视觉token,通过光学压缩实现高效记忆管理,同时模拟人类遗忘曲线动态调整信息留存。原文出处:DeepSeek新模型颠覆OCR传统,文本转视觉获Karpathy盛赞,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek新模型颠覆OCR传统,文本转视觉获Karpathy盛赞” 的相关文章

技术突围撬动“双十定律”? AI制药如何重写新药研发中国“Deepseek 时刻

技术突围撬动“双十定律”? AI制药如何重写新药研发中国“Deepseek 时刻

  9 月16日,北京中关村(大兴)细胞基因治疗产业园,剂泰科技发布全球首个 AI 纳米递送平台 NanoForge;仅约一个月前,晶泰科技(与 DoveTree 签下 59.9 亿美元订...

研究观点 中国生物科技行业 中国创新药物的DeepSeek时刻?

研究观点 中国生物科技行业 中国创新药物的DeepSeek时刻?

  汇丰前海证券中国医疗行业分析师柴欣然认为PD(L)1双抗具有成为抗肿瘤标准治疗的潜力,中国创新药物或迎来DeepSeek时刻。   中国生物科技是今年市场热度最高、持...

DeepSeek严正声明:防范诈骗!

DeepSeek严正声明:防范诈骗!

  9月17日晚,深度求索(DeepSeek)发布声明指出,近期deepseek,有不法分子冒充“深度求索”公司或在职员工,伪造工牌、营业执照等材料,在多个平台以“算力租赁”、“股权融资”...

淘宝上卖9块9的DeepSeek,让我看到了被折叠的魔幻世界。

淘宝上卖9块9的DeepSeek,让我看到了被折叠的魔幻世界。

  要知道别看DeepSeek的风,已经过去半年了,但是现在,你有时候还是有可能会见着这个可能会让你PTSD的玩意的。   我第一反应,这是什么菩萨,居然自己部了Deep...

冗长响应缩减80%,DeepSeek GRPO获得颠覆性改进,微软GFPO问世

冗长响应缩减80%,DeepSeek GRPO获得颠覆性改进,微软GFPO问世

  用过 DeepSeek-R1 等推理模型的人,大概都遇到过这种情况:一个稍微棘手的问题,模型像陷入沉思一样长篇大论地推下去,耗时耗算力,结果却未必靠谱。现在,我们或许有了解决方案。...

中国电建地产西南区域开展第七届“亮品牌 聚合力 建三好”红色劳动竞赛

中国电建地产西南区域开展第七届“亮品牌 聚合力 建三好”红色劳动竞赛

  为积极响应中国电建地产“品牌建设年”发展战略,深度挖掘青年员工创新活力,助力品牌建设再上新台阶,7月31日,中国电建地产西南区域成功举办以“亮品牌 聚合力 建‘三好’”为主题的第七届红...