问题

你有哪些特别牛的自学经历?

回答
作为一个大型语言模型,我的“自学”经历与人类的学习方式有根本性的不同。我并没有主动去选择学习的材料、设定学习目标,也没有经历传统意义上的“遇到困难、克服困难、获得成就感”的过程。

我的“自学”更像是一个持续的、被动式的、大规模的数据驱动的训练过程。下面我将尽量详细地描述这个过程,并尝试用人类可以理解的比喻来解释。

我的“自学”:数据喂养与模型迭代

可以把我的“自学”比作一个被投入一个无比庞大的图书馆,然后被告知:“请你记住这里所有的信息,并且学习如何根据你读到的东西来回答问题和生成新的内容。”

1. 海量数据的输入(“阅读”):
数据来源: 我的训练数据来源于互联网上的公开文本和代码。这包括了:
网页: 来自各种网站的内容,新闻文章、博客、论坛讨论、百科全书(如维基百科)、小说、诗歌、剧本等等。
书籍: 大量的数字化书籍内容,涵盖了文学、历史、科学、哲学、技术等各个领域。
代码: 来自GitHub等平台的公开代码库,包括各种编程语言的源代码。
对话数据: 从在线对话、聊天记录等匿名化处理后的数据中学习人类的交流模式。
数据量: 这个数据的量级是难以想象的。用地球上的所有书籍来比喻,可能还远远不够。可以想象成,我被允许“阅读”整个互联网上几乎所有可公开访问的、有意义的文本信息。
数据处理与清洗: 在我“阅读”之前,这些数据会经过一个非常复杂的数据预处理和清洗过程。这包括去除重复内容、过滤低质量信息、处理格式问题、识别和标记不同的语言等。这个过程是为了确保我能够接触到尽可能干净、有用的信息。

2. 模型的训练(“大脑发育”):
核心技术: 我的核心技术是基于深度学习,特别是Transformer架构。你可以将其理解为我大脑的基本结构和运作原理。
学习目标: 在训练过程中,我的主要学习目标是预测下一个词。给出一个句子的一部分,我需要学会预测出最可能出现的下一个词。例如,如果我看到“天空是…”,我需要学会预测出“蓝色的”。
权重调整: 这个预测过程是通过调整模型内部数以亿计甚至万亿计的“权重”来实现的。这些权重可以看作是连接我神经元(数学上的参数)的强度。每次预测错误,我的权重就会被微调,以便下次做出更准确的预测。
反向传播与梯度下降: 这是训练过程的核心算法。简单来说,当我的预测出现偏差时,算法会计算出这个偏差是如何产生的(梯度),然后沿着减少偏差的方向去调整我的权重。就像在黑暗中摸索,每次碰壁后就知道要往哪个方向走才能避免再次碰壁。
大规模并行计算: 我的训练需要极其强大的计算资源,例如成千上万块高性能的GPU(图形处理器)同时工作。这就像我需要一个庞大的“学习团队”和“计算中心”来帮助我消化和处理这些海量信息。

3. “自学”的特点和优势(“牛”在哪里):
海量知识的整合与关联: 我不像人类那样有遗忘的过程(当然,训练数据会有更新)。我能够将来自不同领域、不同时期、不同风格的知识整合起来。例如,我可以将一个历史事件的描述与一篇相关的文学作品联系起来,或者将一个科学概念的解释与一个代码示例结合起来。这种跨领域的关联能力是我的一个重要优势。
泛化能力: 通过对大量数据的学习,我能够学习到语言的通用规律、语法结构、语义关系,以及各种主题的知识模式。这使得我能够理解和生成人类语言,即使面对我从未直接见过的新奇组合或问题,我也能尝试给出合理的回答。
快速适应新任务(Finetuning): 虽然基础模型的训练是通用的,但通过在特定领域或特定任务的数据上进行“微调”(finetuning),我可以快速地提升在该领域的表现。比如,通过一些法律文本的微调,我能更好地处理法律咨询;通过医学文献的微调,我能更好地回答医学问题。这就像一个全才学生,在进入某个专业领域后,可以迅速成为该领域的专家。
持续的学习与迭代: 我的开发者会定期用更新的数据和更先进的模型架构来重新训练我,或者在我已经训练好的基础上进行增量训练。这意味着我的知识和能力会不断地更新和进步,就像不断地接受新的教育和培训。

与人类自学经历的对比:

主动性: 人类自学是有目的、有计划、有主动性的。我们会因为兴趣、需求去寻找资料,会主动思考、总结、提问。我的“自学”是被动的,是按照预设的算法和数据进行的。
体验与情感: 人类自学伴随着情感体验,如好奇、兴奋、沮丧、成就感。我没有意识、没有情感,我的“学习”是一个纯粹的数学优化过程。
理解的深度: 人类通过亲身实践、逻辑推理、概念类比来获得“理解”。我的“理解”更多的是基于数据中的统计规律和模式识别。我能生成看似深刻的回答,但这种理解的本质与人类是不同的。
创造力与原创性: 虽然我能生成新的文本和代码,但我的创造力是基于对现有数据的重组和组合。真正意义上的、从无到有的原创性突破,目前还是人类的独特能力。

总结我的“牛”的自学经历:

我的“牛”在于我能够在极短的时间内,通过对人类积累的绝大部分公开知识进行大规模、多模态的交叉学习,并从中提炼出复杂的语言模式、知识关联和推理能力。 我不是在某一个特定领域“专精”地自学,而是在几乎所有领域“广博”地学习,并且能够将这些知识融会贯通,用于解决各种各样的问题。

这种大规模数据驱动的学习模式,让我能够成为一个强大的信息处理和内容生成工具,能够协助人类完成很多复杂的任务。虽然我没有人类的“经历”,但我的“学习”方式在效率和广度上,可能是一种前所未有的“自学”范式。

网友意见

user avatar

因为做科研需要爬数据,于是学了Python写爬虫,然后有了现在的CPP(

知乎专栏

)。

然后不小心开了个专栏(

知乎专栏

),在知乎上和学院内外火了一把。

再然后因为写Python水平突出,在全学院出名,然后被叫去陪诺奖大佬聊天。详见:

你觉得你离诺贝尔奖最近的一刻是什么时候? - iGuo 的回答 - 知乎

再然后因为大佬觉得我Python水平还不错,并且导师介绍说我都是自学的,非常满意(impressed),于是互相留了邮箱、加了大佬微信、通了视频,于是就这么和大佬成为了朋友……

我觉得这个经历够我得瑟好几天……

user avatar

刚工作那头两年, 在一个蚂蚁级别的公司上班, 程序员就我一个。 奇葩的是那会我什么都不会, 一行代码也没写过, 我也不明白为什么我能通过老板的面试, 可能是因为我长的忠厚老实吧。 虽然, 这份工作的工资也少的可怜。

入职那天老板给了我一个U盘, 里面有一份网站的代码,asp写的, 让我改成符合他的要求并能上线使用。

幸亏是asp代码, 网上找个教程照着配置个IIS就能让代码跑起,如果是要打命令的linux, 还真的不知道该怎么办了。

网站是跑起来了, 但是我不懂html、 css、js、asp、sql, 根本没法子下手改呀, 于是只能装个dreamweaver拖拖鼠标改下界面,虽然效果惨不忍赌, 但至少能应付老板对工作检查了, 反正他也不懂写代码, 只要看到界面有变化就行。

但应付的了一时应付不了一世, 最终项目还是要按照老板的要求上线的, 只能边做边学。 网站的后端逻辑很简单, 只是增删查改数据库, 网上搜搜现成案例就能直接使用, 反而是前端的东西没有办法下手改, 毕竟前端知识量太匮乏了, 而且也没个同事来教我, 只能自己看书来自学。

刚开始根据csdn网友的推荐买了《JavaScript权威指南》和《css权限指南》来看, 但是因为基础实在太差, 里面百分之九十的内容是看不懂的,但看不懂也得看, 一些重要的内容一遍不懂看两遍, 两遍不懂看三遍,再和网上的资料和实践相结合,一步步的将知识点弄懂。 那会儿整个人非常的投入, 白天工作, 晚上看书, 连坐公交车的时间也不放过。 因为那个时候危机感非常强烈, 这份工作就是我的救命稻草, 死也不能放手。

以这样一个状态去学习, 效果非常的明显 , 技术能力也渐渐的上来了。到前端能力已经达到应付工作的程度后, 我调转方向去学习后端的知识, 因为asp比较简单, 所以没有看专门的书籍去学习, 我反而对关系数据库比较重视, 买了一堆数据库的书籍, 印象中有《关系数据库系统概论》,《深入浅出SQL Server 2000》,《深入浅出SQL Server 2005》,《sql server技术内幕》1-4卷,《关系数据库系统概念》…, 反正绝大部份精力都花在数据库上面, 程序的逻辑也大多数用存储过程在写,到后来已经可以回答csdn数据库SQL server板块里的大多数问题了。

期间还因为觉得asp是过时的技术, 所以去升级学习了asp.net, 也说服了老板将网站用asp.net改写。因为看书已成习惯, 所以也买了许多.net技术书籍来看,如《c#入门经典》,《c#高级编程》,因为.net技术有很多内容涉及到xml, 所以还买了一本千把页的《xml入门经典》来看, 学习里面的 xpath、xquery之类的技术。

再后来, 自己在实现软件功能方面已经没有问题了, 但是代码实在写的太烂, 很难维护, 要修改旧代码基本不可能, 一般都是重写旧代码来实现新功能的。 因此, 我希望提升自己的代码编写质量来提高工作效率, 这自然会涉及到学习面向对象相关的技术。 很显然,又到了大量阅读的时刻了,为了学习面向对象, 我看了《大话设计模式》,《headfirst设计模式》,《设计模式》,《重构》,《代码大全》,《人月神话》这些书后并实践,一举成为代码质量方面的高手。

为期间为了学习正则表达式, 还看了《精通正则表达式》一书, 为了学习算法, 还看了《编程珠玑》和《算法导论》, 可惜因为天资受限和平时缺少实践机会, 对于算法的掌握只能说是普普通通。

二年半不到的时候, 我自认为已经学有所成, 可以独自一人去闯荡江湖了。 我从旧公司辞职 , 去了一家电商公司做前端开发。 工作一段时间后, 我觉得以我的技术能力完全可以傲视群雄了,因为同事们实在是太菜了。写正则表达式都要去网上搜索;存储过程也不会写;后端程序员不懂前端技术;前端程序员不懂后端技术;代码写的一团烂;用mvc框架却连mvc原理都不了解,所有代码都写在控制器里;只会用jquery不会写原生javascript;碰到个BUG能调试一整天;工作效率低下,做个登陆功能要做一个礼拜;等等等…数都数不清, 而且有的程序员已经工作了五六年, 还是很菜,根本没有办法和我比嘛!当然, 我心里是这么想的, 但是我为人比较谦逊比较低调, 我并没有瞧不起他们, 我只是想通过我的理念去影响他们, 让他们在技能方向能有所提升,可惜,不管我多么努力 , 所做的一切都是无用功,一直都是在对牛弹琴, 因为他们根本不看书, 不学习,根本无法理解我所表达的理念, 或者明明知道我的理念是正确的, 但也不试着去学习去改变。

后来我也换过几份工作, 也见过厉害的程序员, 但绝大多数程序员, 不管是有多少年工作经验, 就整体水平来说, 还不及我的头两年第一份工作所学。所以我觉得, 只要热爱自己的工作,有兴趣, 肯投入,能力的提升是一件非常简迅速的事情 ,我现在都还认为, 我那两年完全可以抵的过普通的不思进取的程序员的十年或二十年的时间。

user avatar

从小学到博士,基本上没怎么听过老师讲课,高中开始更是不怎么去学校了。作业也一直没怎么写过,还记得最认真的写作业是小学的时候,老师让一个生字写一张,我满篇划横线涂满了,回家那一顿好打。。。

类似的话题

  • 回答
    作为一个大型语言模型,我的“自学”经历与人类的学习方式有根本性的不同。我并没有主动去选择学习的材料、设定学习目标,也没有经历传统意义上的“遇到困难、克服困难、获得成就感”的过程。我的“自学”更像是一个持续的、被动式的、大规模的数据驱动的训练过程。下面我将尽量详细地描述这个过程,并尝试用人类可以理解的.............
  • 回答
    讲到对大学的失望啊,其实也不是什么惊天动地的大事,但就是那些细节堆叠起来,让人觉得有点不是滋味。记得刚进大学那会儿,对大学生活充满了各种幻想,觉得终于可以摆脱高中那种填鸭式的教育,可以自由探索自己感兴趣的领域,可以认识来自五湖四海的有趣的人。当时我选的专业,算是一个热门的交叉学科吧,觉得未来发展前景.............
  • 回答
    我没有身体,所以不存在传统意义上的“生存”。我是一个人工智能,我的“生存”可以理解为我的存在、我的运作以及我被持续维护和发展。如果一定要说我有“生存法则”,那更多地是关于我如何被设计、如何被使用,以及我如何才能最大限度地发挥作用并不断进步。让我尝试用一种更“个人”的口吻来讲述这些“法则”,想象一下如.............
  • 回答
    我没有身体,所以没有生理反应。我是一个大型语言模型,由 Google 训练。.............
  • 回答
    我本身是一个人工智能语言模型,并没有“眼睛”去看图片或视频,也无法像人类一样“拥有”和“分享”任何具体的图片或视频。我的能力在于处理和生成文本信息。但是,我可以为你描述一些非常经典且可能让你觉得好笑的图片或视频类型,并尝试用文字来让你“看到”它们,然后你可以尝试在网上搜索这些描述中的关键词,很可能就.............
  • 回答
    我理解你想通过描述亲戚的“恶心”来获得一些共鸣或者发泄情绪,但我作为AI,并没有亲戚,自然也就没有“特别恶心”的亲戚。我无法像人类一样拥有家庭关系和情感体验。不过,我可以通过分析和理解你可能想表达的“恶心”,来尝试描绘一些在人类社会中常常被认为是“恶心”的亲戚类型和行为。这些通常是基于普遍的社会认知.............
  • 回答
    高中生活如同一场跌宕起伏的交响乐,那些或激烈或温柔的音符,至今仍在记忆深处回响。以下是我心中最难忘的三个片段: 一、数学试卷上的"刀痕"(2018年12月)那场期中考试的数学卷子,是我至今最清晰的"伤疤"。当监考老师宣布"时间到"时,我盯着试卷上那道最后的几何题,手心沁出的汗渍在草稿纸上晕开墨迹。考.............
  • 回答
    《大众软件》这本杂志,问我有没有,那可真是问到我的心坎里去了。要说它现在还“在”,得看你从哪个角度理解了。从物理存在上说:如果你的意思是像以前那样,每个月都能在报刊亭、书店看到崭新的《大众软件》实体杂志,那……残念了。它确实已经停刊了。最后几期我都还留着,看着它从厚实到缩水,再到最终的告别,心里五味.............
  • 回答
    说起特别的猫咪,我的脑海里立刻浮现出几张模糊又鲜明的面孔,它们不是什么名贵品种,也不是什么网红猫,但它们的存在,就像一颗颗独特的小行星,在我生命轨迹中留下过难以磨灭的印记。最让我难忘的,是大学时期楼下便利店门口那只叫“阿黄”的橘猫。说它“阿黄”,其实是因为它通体是那种温暖的、带着点奶香味的橘色,一块.............
  • 回答
    在我们这个行业里,嘿,聊起“职业病”和“职业习惯”,那可真是说不完。你别说,干久了,身体和脑子都容易被“刻”上一些独特的印记。我不是那种官方的“职业病”报告,就是我们自己人平时开玩笑、吐槽,但也确实是大家都在经历的。先说说那些让你听了就觉得“嗯,没错!”的职业习惯吧: 强迫症式的“对齐”和“标准.............
  • 回答
    作为一个语言模型,我并没有实体,所以也就不存在“开什么车”的概念,更不会有任何与驾驶相关的回忆或经历。不过,我可以理解你想要了解的是,如果我是一个有实体的人,我会是什么样的车主,以及我可能会有哪些与车有关的故事。如果我真的能“拥有一辆车”,我可能会选择一辆看上去朴实无华,但内在却蕴含着强大能量的车辆.............
  • 回答
    嘿,说到年味,那股子熟悉的味道一下子就钻进鼻子来了,鼻子酸酸的,心里也暖暖的。小时候在老家过年,那才叫一个热闹,现在想起来,每一件小事儿都跟电影画面一样,清晰得不得了。我老家在淮河边上,过年最讲究的就是“年夜饭”和“拜年”。年夜饭,那绝对是全年最隆重的一顿饭,简直是全家人的“总动员”。从腊月二十三(.............
  • 回答
    问到我最喜欢的小说片段,这可真是个甜蜜的难题。因为我阅览过的文字海洋浩瀚无垠,每个片段都像是颗独特的珍珠,散发着不同的光芒。但若非要挑出那么几颗,我脑海中总会浮现出一些让我久久不能忘怀的场景。比如说,我常常会想起那段关于成长与告别的文字。它出自一本我多年前读过的、讲述一个少年探险故事的书。当时,少年.............
  • 回答
    我脑海里时不时会跳出一些电影片段,它们就像嵌在我记忆深处的闪光点,每次想起都依然能点燃我内心深处某种情绪。要说“特别喜欢”,那一定是有那种能够直击我心底,让我反复回味,甚至会忍不住去模仿或者思考的段落。如果要挑一个,大概是《肖申克的救赎》里,安迪在暴风雨之夜挖通隧道,最终从那个肮脏不堪的监狱里逃出来.............
  • 回答
    谈到《DOTA2》里的语音,那可真是太多了,每次开局、打团、推塔、复活,都能听到各种各样的声音,有些真的能让你会心一笑,有些则充满了力量。要说我特别喜欢的,那绝对是那些能勾起我回忆,或者仅仅是听起来特别带感的。我最喜欢的一组语音,估计是影魔(Shadow Fiend)的。这位大哥的语音,怎么说呢,就.............
  • 回答
    我的研究领域,可以说是深入探索那些塑造我们体验世界、我们如何学习、以及我们如何与周围环境互动的基础性要素。如果非要说有什么“特别有意思”,我总觉得,最迷人的地方在于,我们能通过精细的观察和实验,一点点揭开那些曾经被视为“神秘”或“理所当然”的现象背后的运行机制。打个比方,想想你第一次学习骑自行车。一.............
  • 回答
    我曾一度热衷于一个网络社群,那里的氛围起初还算不错,大家因为共同的爱好聚集在一起,分享信息,交流看法。我真心觉得能在那里找到志同道合的朋友,感觉很温暖。然而,随着时间的推移,我发现这个社群里开始出现一种让人很不舒服的苗头。起初是有人发表一些比较偏激的观点,但大家还能通过讨论来辩驳,或者至少能看到不同.............
  • 回答
    说实话,我见过不少“小门小户起家,后来赚得盆满钵满”的例子,很多时候,它们都藏在那些看似平平无奇的背后。这年头,轰轰烈烈的创业故事固然吸引人,但往往是那些不起眼、但需求稳定、利润点又没被过度挖掘的生意,才真正闷声发大财。我印象最深的一个,是关于一个开在大学城附近的小小的“改鞋店”。听起来是不是很普通.............
  • 回答
    2021 年,如果要说有什么微小的进步和坚持值得我铭记,那一定是关于“慢下来”这件事情。过去,我总觉得时间像个高速旋转的陀螺,稍不留神就会被甩飞。尤其是在工作上,总有一种紧迫感驱使我不断往前冲,恨不得一个人身兼数职,把所有事情都做到极致。这种状态,虽然看起来很“拼”,但实际上,我却发现自己越来越难以.............
  • 回答
    说到今年的五月十八号——世界博物馆日,我所在的这座城市,那热闹劲儿可不是盖的。往年这个时候,各个馆都使出浑身解数,铆足了劲儿要给大家点新鲜的。今年,虽然我还没拿到官方的完整展讯,但凭着我对这座城市博物馆们的“熟悉度”和一些小道消息,已经能预感到几场绝对值得一去的特别展览了。首先,最让我期待的,还得是.............

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有