Skip to content

Conversation

@ytivy
Copy link
Contributor

@ytivy ytivy commented Oct 24, 2024

This PR add model converter from hugging face format into megatron-LM format

@ytivy
Copy link
Contributor Author

ytivy commented Oct 24, 2024

実行時にMegatron-LMのコードが動くのですが、args.save_intervalを設定せずに動かすためスクリプトを改変した箇所でエラーが発生します。
この問題を解決してからPRをreadyに変更予定。
該当部分をコメントアウトすれば動きます。

@ytivy
Copy link
Contributor Author

ytivy commented Oct 24, 2024

新規追加するスクリプト名が hf2megatron.sh のため、既存のmegatron -> HF形式変換スクリプト converter.shmegatron2hf.sh にしても良いと思います。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

2 participants