4热度
11回答
[ggerganov/llama.cpp]Windows XP:支持MinGW 8.1.0
4热度
5回答
[ggerganov/llama.cpp]添加对oai python服务器中函数调用的基本支持
0热度
17回答
[ggerganov/llama.cpp]简单的转换脚本在 Linux 上耗尽了 tmpfs 空间
4热度
5回答
[ggerganov/llama.cpp]iOS swift 包似乎使用了 NEWLAPACK 的内部符号:cblas_sgemm,导致使用此符号的应用程序无法发布到 App Store
3热度
16回答
[ggerganov/llama.cpp][用户] 实现 Streaming LLM - 让推理更高效
9热度
16回答
[ggerganov/llama.cpp]转换:更新 Falcon 脚本以适应新的 HF 配置
6热度
5回答
[ggerganov/llama.cpp][bug] 运行多 GPU 推理时,ROCm 出现段错误。
2热度
5回答
[ggerganov/llama.cpp]即使不处于交互模式,也启用 sigint 处理程序
7热度
13回答
[ggerganov/llama.cpp]通过放宽 constness 来修复 ROCM 构建
5热度
8回答
[ggerganov/llama.cpp]metal:修复 #2268 之后的构建错误和 rope kernel sig
3热度
14回答
[ggerganov/llama.cpp]同步:ggml(后端 v2)
6热度
26回答
[ggerganov/llama.cpp]检查 CUDA 内存池支持
4热度
2回答
[SJTU-IPADS/PowerInfer]通义千问大模型什么时候能支持呢?我们在用72B、14B的,迫切希望能支持加速推理。
2热度
3回答
6热度
3回答
[SJTU-IPADS/PowerInfer]windows visual studio编译失败
4热度
3回答
[SJTU-IPADS/PowerInfer]请问你们是否有兴趣支持deepseek?
2热度
2回答
[SJTU-IPADS/PowerInfer]请问下针对消费级卡的服务器的适配。
3热度
7回答
5热度
2回答
[SJTU-IPADS/PowerInfer]ReluFalcon 40B 在llama.cpp上无效输出
3热度
1回答
[SJTU-IPADS/PowerInfer]关于在A100显卡上测得的效果异常的疑问