
知乎 - 有问题,就会有答案
为什么传统机器学习,都会用predict表示预测,而深度学习中往往用inference这个词,他们意义有什么不同吗
什么是「推理」 (Reasoning)? - 知乎
在哲学逻辑学、心理学、认知科学、(通用)人工智能等领域,如何对推理进行定义?Reasoning和Inference有…
如何学习大模型的推理加速,学习路线是什么,在进行大模型的端侧推 …
High-throughput Generative Inference of Large Language Models with a Single GPU, ICML 23, Stanford University 利用多级存储在单卡上推理大模型,将模型参数、activation和KV cache卸载到CPU …
机器学习中Inference 和predict的区别是什么?
Inference in deep learning: More specifically, the trained neural network is put to work out in the digital world using what it has learned — to recognize images, spoken words, a blood disease, predict the …
你所读的统计学方向,有哪些不错的讲义(Notes)? - 知乎
Trevor Hastie 的三本必读大作 [统计推断] Computer Age Statistical Inference 两位统计学泰斗Bradley Efron和Trevor Hastie所著。 这本书不是简单的教材或者notes,而是为统计学的发展著书立传,如 …
[CMoE: Fast Carving of Mixture-of-Experts for Efficient LLM Inference ...
[CMoE: Fast Carving of Mixture-of-Experts for Efficient LLM Inference]: Large language models (LLMs) achieve impressive performance by scaling model parameters, but this comes with significant infer…
请解释下variational inference? - 知乎
进一步地,operator variational inference (OPVI) [19] 则重新审视了这个优化目标的设计问题,提出了一个更加general的框架,把KL纳入其中。 总的来说,相比前两类问题,这个问题的工作较少,毕竟我 …
神经网络中训练和推理有什么区别? - 知乎
推断(Inference)可以使用低精度的技术,训练的时候因为要保证前后向传播,每次梯度的更新是很微小的,这个时候需要相对较高的精度,一般来说需要float型,如FP32,32位的浮点型来处理数据,但 …
大模型Inference的性能指标有哪些? - 知乎
📌 本期介绍大模型推理(Inference)的性能指标有哪些? 📌 对于Agent相关岗位,了解Inference Metrics对于选取不同供应商API/本地 ...
如何简单易懂地理解变分推断 (variational inference)?
笔者在入门VAE(Variational Autoencoder)的时候,发现几乎所有博客都会提到 变分推断 (Variational Inference)和 ELBO (证据下界,Evidence Lower Bound),但是总是搞不明白具体是什么意思, …