Llama - 搜索

约 3,110,000 个结果

在新选项卡中打开链接

时间不限

zhihu.com
https://www.zhihu.com › question
如何评价 LLaMA 模型泄露？ - 知乎
网页这种代码写起来虽然不难，但是确实会费一点时间，有些API接口你忘记了，或者不知道怎么用，这时候用ChatGPT帮助很大，因为在网上查的话，不一定就能查到你想要的。. 对于ChatGPT的更多种用法，相比网上说法更多了，我也就不赘述了。. 对于开源的llama，其 ...
zhihu.com
https://www.zhihu.com › question
知乎，让每一次点击都充满意义 —— 欢迎来到知乎，发现问题背 …
网页知乎，让每一次点击都充满意义 —— 欢迎来到知乎，发现问题背后的世界。
zhihu.com
https://www.zhihu.com › question
Meta AI 为什么会开源 Llama2 呢? - 知乎
网页2023年7月20日 — 1、Meta做了一个艰难的决定。. ChatGPT捷足先登，想扳回很难了，再说LLaMA2是个模型，对标的是gpt3.5或gpt4那样的模型，并不是像ChatGPT那样的一个产品，从模型到产品之间还有很多步，追赶太困难了. 2、与其那样追赶，还不如做大语言模型界的Android，其实这个目的 ...
zhihu.com
https://www.zhihu.com › question
如何看待李开复零一万物开源Yi大模型被指抄袭LLaMA? - 知乎
网页他们给的数据全方位吊打 llama 2-70b，这种贴出来就问你信不信？之前就写过一篇文章，聊了聊大模型测评国内的一些乱象，感兴趣的可以点击这里：然后呢，有网友就开始测试，发现题目还没出，Yi Model 就开始背答案了。
zhihu.com
https://www.zhihu.com › topic › hot
llama - 知乎
网页这个事情发酵的点有几个：作为基座模型，被测出故意去“刷题”；完全是LLAMA的结构，但对变量改名导致不能直接套入LLAMA生态；Long Context部分发现就只改了个base。. 个人评价，利益无关：确实值得批评一下；没啥好说的；大家可能很期待看到有什么long context ...
zhihu.com
https://www.zhihu.com › question
llama中文模型使用？ - 知乎
网页2024年1月8日 — LLaMA 模型是目前最流行和性能最强大的开源模型之一，基于 LLaMA 所构造的模型生态可以覆盖绝大部分模型使用场景。. 本节将介绍LLaMA的模型结构及代码实现。. 与在之前文章中所介绍的 Transformer架构（爱吃牛油果的璐璐：万字长文全面解析transformer (二更，附 ...
zhihu.com
https://www.zhihu.com › tardis › bd › art
LLaMa-1 技术详解 - 知乎
网页LLaMa 采用了高效的 causal multi-head attention (基于 xformers)，不存储注意力权重，且不计算 mask 掉的 query 和 key 的值。为了进一步提高训练效率，LLaMa 通过 checkpointing 技术来减少在反向传播过程中需要重新计算的激活数量。
zhihu.com
https://www.zhihu.com › question
对LLaMA进行中文词表扩充，不使用大量中文推理数据集做微调， …
网页1、向原始LLaMA的词汇表中添加2w个中文词汇，增强了中文的编码和解码效率，提高了LLaMA的中文理解能力。 2、采用Low-Rank Adaptation (LoRA)方法，实现了中文LLaMA和Alpaca的高效训练和部署，使研究人员能够在不过分消耗计算资源的情况下使用模型。
zhihu.com
https://www.zhihu.com › topic › top-answers
llama - 知乎
网页llama 是目前为止，效果最好的开源 llm 之一。精读 llama 的论文及代码，可以很好的了解 llm 的内部原理。本文对 llama 论文进行了介绍，同时附上了关键部分的代码，并对代码做了注释。摘要llama是一个系列模型，模型参数量从7b到65b。
zhihu.com
https://www.zhihu.com › topic
Llama 2 - 知乎
网页Llama 2 的社区许可证相当宽松，且可商用。其代码、预训练模型和微调模型均于今天发布了。通过与 Meta 合作，我们已经顺利地完成了对 Llama 2 的集成，你可以在 Hub 上找到 12 个开放模型 (3 个基础模型以及 3 个微调模型，每个模型都有 2 种 checkpoint: 一个是 Meta ...
分页
- 1
- 2
- 3
- 4
- 下一页