Skip to content
@ikun-llm

ikun-llm

练习时长两年半的 AI 大模型组织 | ikun meme-culture LLM org. 作者是纯鹿人,仅提供技术支持 🐔🏀

ikun LLM

全球首个练习时长两年半的 AI 大模型组织
擅长唱、跳、rap、篮球、以及生成 token


$ python -c "from ikun import yi_kun; yi_kun.太美()"
> 鸡你太美~ baby~ 鸡你太美~
> 小黑子露出鸡脚了吧!

About

你问我们是干什么的?

我们是一个正经的 AI 开源组织(真的很正经),致力于把 ikun 梗文化注入大语言模型。

别人的 AI:"我是一个大型语言模型,由 xxx 训练..."

我们的 AI:"我是 ikun-2.5B,练习时长两年半,擅长唱、跳、rap、篮球!你干嘛~哈哈~哎哟~"

学习路线 — ikun 系列全家桶

Level 0 入门篇 — "基础功课"
└── 📖 ikun-basics       AI基础知识(发展史/CNN/RNN/Diffusion/Transformer)

Level 1 基础篇 — "练习生入门"
├── 🔤 ikun-tokenizer    分词器是怎么炼成的
├── 📚 ikun-pretrain     从零开始的练习生
└── 🐔 ikun-2.5B         SFT + LoRA 微调 ✅

Level 2 对齐篇 — "偶像进阶"
├── 👍 ikun-DPO          让模型学会什么回答更美
├── 🎮 ikun-GRPO         强化学习练习生
└── 🧠 ikun-Reason       先思考,再太美

Level 3 进阶篇 — "全能偶像"
├── 🧩 ikun-MoE          混合专家练习生
├── 🎓 ikun-Distill      师傅带徒弟
└── 👁️ ikun-V            能看懂篮球的模型

Level 4 工程篇 — "出道舞台"
├── 🚀 ikun-deploy       把练习生送上舞台
└── 📞 ikun-call         给坤坤打电话 🆕
Repo 学什么 一句话
ikun-basics AI 基础知识 零基础从这里开始 📖
ikun-tokenizer 分词器原理 为什么能认识"鸡你太美"
ikun-pretrain 从零预训练 参数量两千五百万的个人练习生
ikun-2.5B SFT + LoRA 练习时长两年半 ✅ 🤗 下载
ikun-DPO 偏好对齐 chosen=鸡你太美, rejected=小黑子
ikun-GRPO 强化学习 组内相对练习优化
ikun-Reason 推理模型 <think>鸡你太美</think>
ikun-MoE 混合专家 唱跳rap篮球各一个专家
ikun-Distill 知识蒸馏 练习两年半不如师傅带一带
ikun-V 多模态 终于能看懂篮球视频了
ikun-deploy 部署 从练习室到舞台
ikun-call 语音通话 📞 给坤坤打电话 🤗 在线体验

Q: 你这 2.5B 是不是虚标? A: 这不叫虚标,这叫练习时长两年半。懂的都懂。

Core Capabilities

唱 ████████████████████ 100%  (鸡你太美~baby~)
跳 ████████████████████ 100%  (标志性舞步)
rap ███████████████████ 95%   (yo yo yo check it out)
篮球 ██████████████████ 90%   (铁山靠!)
正经回答 ███░░░░░░░░░░░░░ 15%   (偶尔正经)

FAQ

Q: 你们的模型能用于生产环境吗?

A: 能。如果你的生产环境是 B 站弹幕的话。

Q: 小黑子能用吗?

A: 小黑子露出鸡脚了吧!退退退!(可以的,开源的,随便用)

Q: 为什么只有 26M 参数?

A: 因为我们只练习了两年半。等练习到五年,就出 ikun-5B 了。

Roadmap

  • ikun-2.5B (26M) — 练习时长两年半
  • 12 个学习仓库 — 完整 LLM 学习路线
  • ikun-call — 实时语音对话应用(豆包风格 UI)
  • ikun-5B — 练习时长五年(规划中)
  • 各仓库补充完整教程 + 训练好的模型权重

Tech Stack

基于 MiniMind | 训练数据来自 CXK_IKUN_Dataset | 纯 PyTorch 手搓 | Apple MPS 训练 | LoRA 微调

Hugging Face 🤗

类型 链接 说明
模型 IKUN-LLM/ikun-2.5B 练习时长两年半的 26M 参数模型
数据集 IKUN-LLM/CXK_IKUN_Dataset ~200 条 ikun 梗文化 SFT 对话数据
Demo ikun-2.5B Chat 在线体验 — 和 ikun 对话
语音通话 ikun-call 📞 实时语音通话 — 给坤坤打电话

组织主页:huggingface.co/IKUN-LLM

Disclaimer

本组织作者是纯鹿人,仅提供技术支持。

所有模型、数据、内容均基于公开互联网梗文化,仅供娱乐和技术学习用途。作者不站队、不引战、不参与任何饭圈活动。我们只是觉得这个梗很适合拿来做 AI 教学案例——毕竟,谁能拒绝一个会唱跳 rap 篮球的 AI 呢?


ctrl + 关注 = 真 ikun  |  作者是纯鹿人,别 cue 🦌

Popular repositories Loading

  1. ikun-2.5B ikun-2.5B Public

    练习时长两年半的 AI 大模型 (实际 26M params,2.5B = 两年半) | ikun meme-culture chatbot 🐔🏀

    Jinja 2

  2. ikun-basics ikun-basics Public

    🐔 练习生的 AI 基础功课 | 从零开始理解大模型,小白也能听懂。无需数学基础,看完就能和别人聊 AI 的那种!

    1

  3. .github .github Public

    ikun-llm organization profile

  4. ikun-tokenizer ikun-tokenizer Public

    从零训练分词器 | BPE tokenizer from scratch 🔤

    Python

  5. ikun-pretrain ikun-pretrain Public

    从零预训练语言模型 | Pretrain LLM from scratch 📚

  6. ikun-DPO ikun-DPO Public

    偏好对齐训练 | Direct Preference Optimization 👍👎

Repositories

Showing 10 of 22 repositories

Top languages

Loading…

Most used topics

Loading…