embedding.cc

AI 工程师 / 技术爱好者

开源项目

OpenClaw
OpenCode
DeepWiki

技术分享

询问DeepWiki关于vllm-ascend的FULL_DECODE_ONLY图模式的问题

微信推文

WiFi 不仅能上网,还能"透视"?
当 Speculative Decoding 还不够快时,他们把"猜测"也提前猜了一遍
CUDA Agent:当 AI 开始自己写高性能 CUDA 算子,GPU 优化这件事要变天了
一个能"自我生存"的 AI?Automaton 项目深度解析
字节开源 OpenViking:给 AI Agent 装上一颗"可进化的大脑"
还在为 Seedance 2.0 提示词而发愁吗?解锁 seedance-prompt-skill 技能

技能

AI Infra
AI 基础设施 / 算力调度
vLLM
大模型推理服务 / 部署优化
Nginx
反向代理 / 负载均衡
Agent Engineering
AI Agent 开发 / 工作流编排
小模型 / 机器学习
模型优化 / 端侧部署 / 推理加速
算子 / Kernel 开发
高性能计算 / CUDA / 性能优化