发现很多人其实是本地小模型特点如下： - 参数量极小：可能是2B - 训练集极小：甚至大部分都是污染数据 -预训练轮数少：通常不收敛 - 上下文极小：不超过500字 - 注意力：是稀疏的 - 联网搜索：是不会的 - 思维链：是没有的 - 输出：不是幻觉就是过拟合 (水城百事)

by 匿名, Thursday, July 02, 2026, 08:11

[ No text ]

12 views

哈哈哈，他们那点脑容量，可能连小模型都不如，不过2B是有的

by 匿名, Thursday, July 02, 2026, 09:06 @ 匿名

[ No text ]

10 views

by 匿名, Thursday, July 02, 2026, 09:19 @ 匿名

[ No text ]

10 views

by 匿名, Thursday, July 02, 2026, 09:38 @ 匿名

[ No text ]

9 views

by 匿名, Thursday, July 02, 2026, 09:47 @ 匿名

[ No text ]

8 views

by 匿名, Thursday, July 02, 2026, 10:38 @ 匿名

[ No text ]

8 views