水城社区 - Kitchener, Waterloo, Cambridge & Guelph 华人的网上家园
   论坛首页   滑铁卢黄页   滑铁卢租房   滑铁卢房产市场 
Hierarchical -->     

发现很多人其实是本地小模型特点如下: - 参数量极小:可能是2B - 训练集极小:甚至大部分都是污染数据 -预训练轮数少:通常不收敛 - 上下文极小:不超过500字 - 注意力:是稀疏的 - 联网搜索:是不会的 - 思维链:是没有的 - 输出:不是幻觉就是过拟合 (水城百事)

by 匿名, Thursday, July 02, 2026, 08:11

[ No text ]

  12 views

哈哈哈,他们那点脑容量,可能连小模型都不如,不过2B是有的

by 匿名, Thursday, July 02, 2026, 09:06 @ 匿名

[ No text ]

  10 views

这个描述,估计它们脑子处理不了:-D :-D :-D

by 匿名, Thursday, July 02, 2026, 09:19 @ 匿名

[ No text ]

  10 views

2B都没有。很多明明是hardcode的逻辑,还楞说自己是大模型。

by 匿名, Thursday, July 02, 2026, 09:38 @ 匿名

[ No text ]

  9 views

千亿级别大模型训练完之后文件尺寸都不小。FP32:≈650GB,FP16:≈325GB, INT8:≈162GB,INT4:≈81GB。本机装的就几个G的文件,就不要指望有多么好的推理结果了

by 匿名, Thursday, July 02, 2026, 09:47 @ 匿名

[ No text ]

  8 views

他们自带2B标签,这是一种冗余

by 匿名, Thursday, July 02, 2026, 10:38 @ 匿名

[ No text ]

  8 views
1329271 Postings in 193845 Threads, 2660 registered users, 712 users online (3 registered, 709 guests)
滑铁卢华人|KWCG生活论坛-Kitchener, Waterloo, Cambridge & Guelph华人的网上家园