embedding
.cc
AI 工程师 / 技术爱好者
GitHub
Reddit
知乎
X
Threads
Medium
Dinq
[email protected]
开源项目
OpenClaw
开源 AI Agent 框架,终端上的智能助手
OpenCode
AI 编程助手,让开发更高效
DeepWiki
AI 驱动的代码智能解读工具
技术分享
询问DeepWiki关于vllm-ascend的FULL_DECODE_ONLY图模式的问题
2026-03-06
微信推文
WiFi 不仅能上网,还能"透视"?
2026-03-08
当 Speculative Decoding 还不够快时,他们把"猜测"也提前猜了一遍
2026-03-08
CUDA Agent:当 AI 开始自己写高性能 CUDA 算子,GPU 优化这件事要变天了
2026-03-08
一个能"自我生存"的 AI?Automaton 项目深度解析
2026-02-19
字节开源 OpenViking:给 AI Agent 装上一颗"可进化的大脑"
2026-02-18
还在为 Seedance 2.0 提示词而发愁吗?解锁 seedance-prompt-skill 技能
2026-02-18
技能
AI Infra
AI 基础设施 / 算力调度
vLLM
大模型推理服务 / 部署优化
Nginx
反向代理 / 负载均衡
Agent Engineering
AI Agent 开发 / 工作流编排
小模型 / 机器学习
模型优化 / 端侧部署 / 推理加速
算子 / Kernel 开发
高性能计算 / CUDA / 性能优化