Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

分阶段微调是否合适? (微调上的细节问题) #276

Open
Rocky77JHxu opened this issue Jul 16, 2024 · 8 comments
Open

分阶段微调是否合适? (微调上的细节问题) #276

Rocky77JHxu opened this issue Jul 16, 2024 · 8 comments
Labels

Comments

@Rocky77JHxu
Copy link

您好,您们的工作分享对于LLM初学者来说有着很大的启发!我也是其中之一。

在浏览完所有自述文件后,我观察到您们有多个数据集,特别是包含了大量角色扮演的数据集。我想请教下您们对于多个角色,是通过微调不同的角色模型,还是通过分阶段微调来对一个模型不断增强?如果是分阶段微调的话,具体是怎么做的呢?

因为我之前尝试实战了一个医疗大模型的微调,我发现医疗下仍然有很多细分场景,比如智能问诊,医药问答,以及您们工作中所提到的心理健康等等。我在思考这些细分场景是全部塞入一个大数据集内统一微调,还是分阶段微调合适呢?

这个问题相对来说偏于个人,如果能收到您们的答复,我将不胜感激!

@aJupyter
Copy link
Collaborator

都可以尝试,不一定哪种方案好
我们采取的是前者

@Rocky77JHxu
Copy link
Author

都可以尝试,不一定哪种方案好 我们采取的是前者

好的,非常感谢!

@aJupyter
Copy link
Collaborator

建议关注仓库,后续考虑放出一些细节or视频教程

@Rocky77JHxu
Copy link
Author

建议关注仓库,后续考虑放出一些细节or视频教程

好的,谢谢。

@chg0901 chg0901 added the Informative Responses to Thoughtful Questions Good Answers for QA Issues label Jul 26, 2024
@chg0901
Copy link
Collaborator

chg0901 commented Jul 26, 2024

重新开一下吧, 我等着在emollm3.0上训练下爹系男友试试,爹系男友V2.0训了3个epoch,其实有点多

@chg0901 chg0901 reopened this Jul 26, 2024
@chg0901 chg0901 changed the title 微调上的细节问题 分阶段微调是否合适? (微调上的细节问题) Jul 29, 2024
@chg0901
Copy link
Collaborator

chg0901 commented Jul 29, 2024

您好,您们的工作分享对于LLM初学者来说有着很大的启发!我也是其中之一。

在浏览完所有自述文件后,我观察到您们有多个数据集,特别是包含了大量角色扮演的数据集。我想请教下您们对于多个角色,是通过微调不同的角色模型,还是通过分阶段微调来对一个模型不断增强?如果是分阶段微调的话,具体是怎么做的呢?

因为我之前尝试实战了一个医疗大模型的微调,我发现医疗下仍然有很多细分场景,比如智能问诊,医药问答,以及您们工作中所提到的心理健康等等。我在思考这些细分场景是全部塞入一个大数据集内统一微调,还是分阶段微调合适呢?

这个问题相对来说偏于个人,如果能收到您们的答复,我将不胜感激!

最近有个基于internlm做的项目, 它采用的方法就是多轮次微调训练的方法,

但是是否真正有效,还是要取决于数据集,微调方法和参数的,

@Rocky77JHxu
Copy link
Author

您好,您们的工作分享对于LLM初学者来说有着很大的启发!我也是其中之一。
在浏览完所有自述文件后,我观察到您们有多个数据集,特别是包含了大量角色扮演的数据集。我想请教下您们对于多个角色,是通过微调不同的角色模型,还是通过分阶段微调来对一个模型不断增强?如果是分阶段微调的话,具体是怎么做的呢?
因为我之前尝试实战了一个医疗大模型的微调,我发现医疗下仍然有很多细分场景,比如智能问诊,医药问答,以及您们工作中所提到的心理健康等等。我在思考这些细分场景是全部塞入一个大数据集内统一微调,还是分阶段微调合适呢?
这个问题相对来说偏于个人,如果能收到您们的答复,我将不胜感激!

最近有个基于internlm做的项目, 它采用的方法就是多轮次微调训练的方法,

但是是否真正有效,还是要取决于数据集,微调方法和参数的,

可以了解下分阶段微调的策略是什么样的嘛?

@chg0901
Copy link
Collaborator

chg0901 commented Aug 13, 2024

  1. 相同数据,微调多次,里面有初始化的问题
  2. 不同数据,微调多次,类似增强学习的程度
  3. 结合以上两种

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

No branches or pull requests

3 participants