在数字化办公席卷全球的今天,文档解析技术已成为企业数字化转型的关键瓶颈。面对海量的合同、报告、论文等文档资料,传统解决方案要么速度缓慢,要么错误百出。5月22日,字节跳动开源的全新文档解析模型Dolphin横空出世,凭借仅322M参数的轻量级架构,在性能上实现了对GPT-4.1、Claude3.5等重量级模型的全面超越!
github: https://github.com/bytedance/Dolphin
在线Demo: http://115.190.42.15:8888/dolphin
下面开始部署指南:
一、安装依赖环境
二、下载模型权重
选项A:原始模型格式(基于配置)
从百度云或谷歌驱动器下载,并将它们放在。/checkpoint文件夹中。
百度网盘:
https://pan.baidu.com/share/init?surl=5zcARoX0CTOHKbW8bFZovQ&pwd=9rpx
谷歌云盘:
https://drive.google.com/drive/folders/1PQJ3UutepXvunizZEw-uGaQ0BCzf-mie
选项B:Huggingface模型格式
huggingface模型地址:
https://huggingface.co/ByteDance/Dolphin
魔搭的模型地址:
https://www.modelscope.cn/models/ByteDance/Dolphin
#从Hugging Face Hub下载模型
Git LFS安装
git clone https://huggingface.co/ByteDance/Dolphin ./hf_model
本文采用选项A:原始模型格式,百度网盘下载模型权重,放入checkpoints 目录中;
三、实战测试效果
模型推理的配置文件:
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/217713.html