Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

牛皮吹上天了结果一套壳? #245

Closed
zhwl666 opened this issue Feb 3, 2025 · 30 comments
Closed

牛皮吹上天了结果一套壳? #245

zhwl666 opened this issue Feb 3, 2025 · 30 comments

Comments

@zhwl666
Copy link

zhwl666 commented Feb 3, 2025

Image

@suaiodjkas
Copy link

何以见得

@oudev
Copy link

oudev commented Feb 3, 2025

这叫数据污染
有点常识再来吧

@suaiodjkas
Copy link

suaiodjkas commented Feb 3, 2025 via email

@liushangyang
Copy link

你也是无敌了,没常识就算了,到Issues里来拉屎了

@rcitsz
Copy link

rcitsz commented Feb 3, 2025

@zhwl666 你这种低智人要少说话,多学习。

@zhwl666
Copy link
Author

zhwl666 commented Feb 3, 2025

回复那些喷子,自己去deepseek官网去注册个账号,然后去套话,这都能套出来OPENAI的警告了 能说明什么, 偷窃数据都不专业,如果是偷窃数据大不了批量把数据OPENAI的字样改为deepseek就可以了,一个垃圾公司吹上天了,还自嗨.

@thecreativeboy
Copy link

啥都不知道就好好打螺丝,这不是你能掺和的,知道吗?

@liushangyang
Copy link

@zhwl666 你喷什么呢?这里是issues不是让你在这里放垃圾的地方

@zhwl666
Copy link
Author

zhwl666 commented Feb 3, 2025

issues里面一堆返政府的言论都没有人关 我只是说下我个人的看法怎么不行了
这就是一群会炒作的人 靠炒作忽悠一些傻逼的东西也有人信.
你但凡懂点技术脑子正常点自己去deepseek注册个官网账号 聊天套话就知道是怎么回事
别自嗨了

@liushangyang
Copy link

不知道你什么东西,你认为你懂技术结果就在这喷🤣,再见了。你是我第一个”Blocked users“

@PreferredegeT
Copy link

PreferredegeT commented Feb 3, 2025

lmao create a github account for shitposting,are you struggling to figure out how to create a github acc ?good job

@Zegic
Copy link

Zegic commented Feb 3, 2025

好丢人,墙就该把你这种没脑子的人拦住,别在全世界里丢人,喷屎还喷到issues里了,我家狗狗都知道不能在客厅拉屎
we are so sorry for this user "zhwl666" 's rudeness, please ignore him, he might have some kind of mental disease.

@Wiktok
Copy link

Wiktok commented Feb 3, 2025

首先,deepseek-r1开源了,是不是套壳自己去看代码和算法,如果真是,西方国家早就跳起来了嘲讽了,几大巨头还相继接入?此外,openai与deepseek是竞争关系,如果deepseek抄袭openai,openai想必不能忍。

@lozhu
Copy link

lozhu commented Feb 3, 2025 via email

@Wiktok
Copy link

Wiktok commented Feb 3, 2025

大佬,r1开源代码在哪里可以看,我是菜鸡

https://huggingface.co/deepseek-ai/DeepSeek-R1/tree/main

@houyunlong1668
Copy link

我有openai的账号,玩了玩免费版,也用过付费的套壳chatgpto1的网站。与deepseekv3回答的方式是一点不像,知识库的更新时间都不一样,你跟我应该一样,只是玩玩表面的菜鸟,美国白宫认证可比你说话好使。

@amoonhappy
Copy link

大模型有套壳这说法?

R1本身是MoE架构,也开源了,CloseAI的o1是闭源的,模型架构谁都不知道。你意思你知道CloseAI的模型架构?不然你怎么知道是套壳?

你在R1的CoT输出里面看到CloseAI的字样,简单的回答就是R1的SFT训练数据里面有一部分是来自o1的输出的数据。这个方法在大模型技术领域非常常见,特别是硬件限制的场景下,利用最优秀的模型的输出的数据,来对开源模型进行蒸馏,这样就可以用很低的硬件成本训练出效果比肩最优秀的模型的小的开源模型。

大模型圈子里懂技术的都知道chatgpt刚出来后,开源社区就是利用了sharegpt上大家贡献的chatgpt的输出,训练出了Alpaca等开源模型。

所以这是什么套壳?只是训练数据用了一部分CloseAI o1模型输出的数据而已。

Deepseek利用闭源的模型的输出数据,加上自己的模型架构,训练手段,训练出比肩o1的模型。代码开源,训练方法开源,模型权重开源。但凡懂点技术,在这个圈子里,因为各种原因不能在自己项目中使用SaaS模式的CloseAI的最好的模型的同学,哪个不会认为Deepseek R1为全球的开源开发者,商业公司贡献了一个效果比肩CloseAI最优秀的模型的开源模型而拍手称快?

所以你一不懂技术,二不在大模型这个圈子里。

我也就是太无聊了,才来耐心讲这些。不然喷死你。

@duancifu
Copy link

duancifu commented Feb 3, 2025

给湾野狗急麻了。

@konko360
Copy link

konko360 commented Feb 3, 2025

这叫蒸馏,不叫套壳...

蒸馏就相当于刷题背答案,答案里有张三,背的太熟一个不注意张口就会说出张三...
而套壳就相当于是,让老师伪装你去做题,只是提供了件你的衣服...
性质不一样,其实蒸馏技术哪都在用,只不过用多用少而已...

论文里都明确说了,玩的就是蒸馏,现在大家都想知道是怎么玩到极致的

套壳就更不用说了,成百上千的AI应用都是套壳,不套壳咋做应用?
这就像难不成搞个APP还得开发个OS的Kernel内核?
只要别谎称是自己做的,其实套壳也不是什么问题,
难不成用API就不叫套壳?只要授权允许,套就完了

@Hello-world150
Copy link

谁知道你之前的提示词是什么样的,难不成你要求deepseek扮演成chatgpt回答然后又说deepseek回答里有openai的字样?纯纯找茬。

@wx-dev
Copy link

wx-dev commented Feb 4, 2025

我有点明白外网那些弱智的评论是从哪来的了

@NathanYYDS
Copy link

blocked user +1 lol

@Alencryenfo
Copy link

blocked user +1 lol
seemed "like human" instead of "human"

@Alencryenfo
Copy link

Image

only one action

We do not support the use of GitHub as a weapon for national ideological confrontation, nor do we recommend the presence of numerous internet trolls on GitHub.

@fanzhilin89
Copy link

你把所有对话全部放出来,包括提示词。你把所有对话放出来并且能够被复现才能算作你提的算真的,截图什么都不能说明。
这种回答大部分就只是提示词提示而已,别以为我没有多次复现,我可以让他是任何。

@yingzhuo
Copy link

yingzhuo commented Feb 5, 2025

狗逼比死了娘还难受吧。 哈哈。

@Charmnut
Copy link

Charmnut commented Feb 6, 2025

issues里面一堆返政府的言论都没有人关 我只是说下我个人的看法怎么不行了 这就是一群会炒作的人 靠炒作忽悠一些傻逼的东西也有人信. 你但凡懂点技术脑子正常点自己去deepseek注册个官网账号 聊天套话就知道是怎么回事 别自嗨了

zhwl666 doesn't have any public repositories yet.不想把GitHub issue变成吵架的地方,真心发问,你懂什么技术,什么学历

@sevenwong
Copy link

回复那些喷子,自己去deepseek官网去注册个账号,然后去套话,这都能套出来OPENAI的警告了 能说明什么, 偷窃数据都不专业,如果是偷窃数据大不了批量把数据OPENAI的字样改为deepseek就可以了,一个垃圾公司吹上天了,还自嗨.

google的Gemini还说自己是文心一言呢,还说创始人是李彦宏呢,难道你认为Gemini是文心一言套壳?不懂就先研究,免得到处丢人

@sevenwong
Copy link

这叫蒸馏,不叫套壳...

蒸馏就相当于刷题背答案,答案里有张三,背的太熟一个不注意张口就会说出张三... 而套壳就相当于是,让老师伪装你去做题,只是提供了件你的衣服... 性质不一样,其实蒸馏技术哪都在用,只不过用多用少而已...

论文里都明确说了,玩的就是蒸馏,现在大家都想知道是怎么玩到极致的

套壳就更不用说了,成百上千的AI应用都是套壳,不套壳咋做应用? 这就像难不成搞个APP还得开发个OS的Kernel内核? 只要别谎称是自己做的,其实套壳也不是什么问题, 难不成用API就不叫套壳?只要授权允许,套就完了

不懂装懂更可怕,蒸馏是一种模型压缩技术,用于将一个大型复杂模型的知识迁移到一个小型简单模型。 它的目的是让小模型在保持性能的同时,变得更轻量、更高效,便于部署和应用。典型应用是基于原始大参数版本(如deepseek-r1,671B),生成同一款模型的小参数版本(如deepseek-r1,20B、7B、1B等),开发这些小参数版本就会用到知识蒸馏技术。小参数版本在本地部署时对硬件配置要求相对较低。不可能从一个闭源模型蒸馏出另一个模型,因为蒸馏需要原模型的核心算法、模型权重、训练数据、“硬目标”和“软目标”。所以蒸馏 只能在同一个机构或团队内部,或者将一个开源大参数模型压缩为其小参数版本。而题主截图里的这种情况其实是训练ai模型时,使用了其他ai生成的数据进行训练。这种情况其实相当普遍,google的gemini说自己是文心一言老板是李彦宏也是这种情况。

@lion000
Copy link

lion000 commented Feb 8, 2025

你这种傻逼竟让会用github?!还是把你教育的太好了

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests