• 邮件反馈
  • 支持 TK
  • 微博

    • 看看最新
    • 随便看看
    • 过去一周
    • 过去一年
  • 精选

    • 净想好事
    • 安全合辑
    • 疫苗合辑
    • 读书合辑
  • 文档

    • 搜索说明
    • 百元好物
    • tk猴子

  • 支持
下个页面随便看看

© Copyright 2025. All rights reserved.

加入tk真爱粉群
tombkeeper

2025-03-16 12:56

又测了一下。到今天为止,不能完成该编程任务的那几家还是不能完成。//@t0mbkeeper:刚才又测了一下。半年之后,不能完成编程任务的那几个还是不能完成。 DeepSeek v3 不仅可以完成而且比 v2.5 的代码质量更高。DeepSeek R1 也行,但不如 v3 完成的漂亮。

t0mbkeeper

2024-12-29 12:46

这几天很多人都表达了对 DeepSeek 3 训练成本大幅降低的惊叹。但也有人说这是“断章取义”,比如认为他们训练的只是 FP8 精度,强调他们训练用了大量高质量合成数据,并认为得到这些数据的过程所消耗的算力也应该算在训练成本里。

看了两边的观点之后我觉得好像都有道理,而我也没有资格在这个问题上做出评价。模型训练是大玩家们的游戏。我们能关注的还是模型应用。实验室的同学已经在测试 DeepSeek 3 了,具体好不好用也还是要用了才知道。

另外,今年夏天的时候,我用我自己设定的测试任务测了一下几个大模型。国内的大模型多数都不能完成我的编程任务(🔗网页链接 🔗网页链接)。只有当时的 DeepSeek 2.5 和另外一个能完成。

阅读全文 >
阅读全文 >
tombkeeper

2025-03-16 09:22

renew

t0mbkeeper

2024-05-20 07:14

#警方通报胖猫事件调查情况# 你们试试。或者让 ChatGPT 来也行。

阅读全文 >
阅读全文 >
tombkeeper

2025-03-16 09:06

领导,哪怕是县里的领导,也代表了不可冒犯不可质疑的飘渺而又随时凝结的慈父。臧否领导,就是意在慈父。而对于内心世界建立在慈父信仰之上的人来说,这无异于渎神。//@张天英tiry://@顾扯淡:我觉得这类人特别慕强,他眼里没有对错,领导做了什么不重要,反正只要这个位置上的人,那放个屁都是香的,也算某种思想钢印…//@一玶海岸:立志于为他根本就不认识的领导排忧解难……[挖鼻]//@凌晨刚醒:[笑cry] 🔗评论配图 //@纽太普同学:人家贴出来,他说人家编。人家贴来源,他闷声不响装没看见。右边可真是从不打会输的仗//@遗失创造力之人:开局一张图,博主开始编[吃瓜],编到博主没嘛了,他就高兴了[哈哈]

木岛主

2025-03-14 07:28

法门寺,领导来看丝绸……

阅读全文 >
阅读全文 >
tombkeeper

2025-03-15 17:51

之前看到过一个说法:清朝官方语境里的“汉奸”一词,主要是指对清廷心怀不满的“汉人奸民”。

不过光绪二十六年《宣战诏书》里“临阵退缩,甘心从逆,竟作汉奸”的这个“汉奸”感觉应该和今天的意思差不多。

阅读全文 >
tombkeeper

2025-03-15 11:20

今天的盲猜关注列表活动又开始啦!//@跃门_:关注了你和陈岚[思考]//@tombkeeper:今天的盲猜关注列表活动开始啦!//@要色以啊:这就是扯淡了!出现这种情况,说明社会处在危机中,开始进行动员了。我们很多人的脑子总是陷入进步主义陷阱,满脑子都是简单的进步退步。总是认为没皇帝是进步,有皇帝是退步,无语。英国平民工商业者为了进行动员,打败原来的国王势力,不得不把克伦威尔也推举为新国王代表他们利益。国王的再次出现并不与英国平民工商业崛起并产生工商业革命相矛盾。德国工业革命时还是个帝国呢

tombkeeper

2025-03-14 10:11

最近好几个朋友感叹美国人怎么也会搞“将军的恩情还不完”。

哪怕从罗马共和国开始算,或者把希腊城邦里那些也算上,人类开始探索无皇帝生活的时间也就两千多年。而且探索得很艰难,罗马共和国最后还是变成罗马帝国了。我们真正大面积摆脱皇帝也就是最近一百多年的事。

而作为群居动物,在长达几百万年的时间里,智人一直需要皇帝、酋长、部落首领。

“从来就没有什么救世主,也不靠神仙皇帝”是我们的模型训练了几百万年后得出的一组数据,写在内存里,随便有点意外一掉电就没了。而“将军的恩情还不完”则是固件里的出厂设置,稍不留神这个出厂设置就会被加载回来。

阅读全文 >
阅读全文 >
1
...
291292
293
294295
...
6231