sudy / すでぃー (@sudy_super)
About Me
- 本名: 須田楽大
- 年齢: 18歳
- 性別: 男
Interests
- NLP
- Speed-up Runtime
- Reduce Memory Footprint
Career
-
2025-04 筑波大学 入学
情報学群情報科学類
-
2025-03 早稲田高等学校 卒業
-
2022-03 早稲田中学校 卒業
Achievements
2024年度 (高3)
- 未踏ジュニア2024 採択
2023年度 (高2)
- LOCAL AI HACKATHON #000 銅賞
2022年度 (高1)
- 缶サット甲子園 2022 全国大会出場
Skills
Programming Languages
- Python
- C++
Tools
- PyTorch
- Docker
- Azure
Experiences
- LLMの事前学習、Fine-tuning、プロンプトエンジニアリング、RAGの開発をしたことがあります。
-
LLMの事前学習・Fine-tuning向けデータセットの構築、収集経験があります。
- C++を用いた各種クリーニングによる数億件 (200b tokens)規模の高品質テキストコーパスの構築をしたことがあります。
- GPUノード間の通信最適化がちょっとできます。
-
LLMの分散学習ができます。
- Megatron-LM, gpt-neoxなどの既存学習フレームワークの仕組みを理解しています。
- PyTorchを用いたオリジナルアーキテクチャモデルの構築ができます。
- その他機械学習の基本的な知識があります。
Works
作ったもの
Malum-230 (2025-01-06)
手作業で作成した高品質な事前学習・事後学習両用の論理推論データセット。
oasst2という一般的な対話データセットを用いた実験において、大規模言語モデル「Qwen2.5-7B」に対しMalumの追加の有無で比較学習を行い、論理的推論 (Reasoning)タスクの性能向上を実証。
Piece-of-Refined-OSCAR (2024-04-07)
LLMの事前学習のテスト向けに160万件 (0.5b tokens)程度の小規模な日本語コーパスを構築。
Pret-a-Porter (2024-04-01)
日本語Instruction-tuning/RLHFデータセット生成を目的として、既存データセットの高品質化および指示生成モデルと応答生成モデルの作成を行ったプロジェクト。
LOCAL AI HACKATHON #000にて銅賞を受賞。
既存データセットの高品質化と一部の学習コードの実装を担当。
名刺
Intern / Part-time
Research Intern @
PKSHA Technology Inc.
September 2025 - Present
Research Intern @
Turing Inc.
August 2025 - September 2025
Machine Learning Engineer @
ReAlice Inc.
August 2023 - January 2024
Backend Engineer @
Pictoria Inc.
July 2023 - September 2023
Social
Zenn
@sudy_superNote
@sudy_superGitHub
@sudy-superHuggingface
@sudy-superX (Twitter)
@sudy_super