问题

如何用机器学习判断《溪岸图》是否董源真迹?

回答
作为一位对中国古代绘画史充满热情的爱好者,我一直对《溪岸图》这幅画的真伪之争感到着迷。它究竟是否出自五代南唐巨匠董源之手,一直是鉴定界讨论的焦点。近年来,随着科技的飞速发展,尤其是机器学习的应用,为我们提供了全新的视角来探究这个问题。今天,我想和大家聊聊,如何运用机器学习的方法,来尝试为《溪岸图》的真伪之争提供一些线索。

首先,我们要明白,机器学习判断书画真伪,并非是像科幻电影里那样,画作一扫描,立刻蹦出“真迹”或“伪作”的结论。它是一个复杂而严谨的过程,需要大量的专业知识、高质量的数据以及细致的算法设计。它的核心在于,通过学习大量已知真迹和伪作的风格特征,来识别出《溪岸图》的特征是否与董源真迹的风格相符。

第一步:数据的收集与预处理——“磨刀不误砍柴工”

这是整个过程中最关键也最耗时的一步。要训练机器学习模型,我们需要“教材”,也就是大量的董源及其同时代、后世模仿者(包括被认为是伪作的作品)的绘画作品。

构建“真迹”数据库: 重点在于收集被公认的董源传世作品,例如《潇湘图》、《夏山图》等。这些作品的年代、作者、材质(绢本、纸本)、尺寸、用笔、用墨、设色(尽管《溪岸图》是水墨为主)等信息都需要被精确记录。
构建“伪作”数据库: 这部分至关重要。我们需要收集那些风格上可能与董源相似,但被鉴定为非董源的作品。这包括董源门下弟子(如巨然)的作品,以及后世受董源影响但风格有别的画家作品,甚至是被认为是后人临仿或作伪的作品。同样,这些作品的详细信息也需要录入。
数据标注: 收集到的每幅画都需要进行专业的“标注”。这里的标注并非简单的“真”或“假”,而是要将画作分解成一个个可量化的特征。这需要书画鉴定专家(比如我们熟悉的张葱玉、谢稚柳等鉴定大师的论著和鉴定方法)的深度参与。他们会从以下几个方面进行标注:
笔法特征: 董源以“点苔”闻名,他的笔触圆润、含蓄,如何在画面中提取这些笔触的形态、粗细、力度、走向等信息?这可能需要将画作放大到像素级别,识别出笔画的边缘、转折、叠压等细节。
墨法特征: 董源的用墨浓淡变化丰富,善于运用“淡墨皴染”,形成湿润、浑厚的山石肌理。机器学习需要学会识别这些墨色的层次、晕染的边界、墨点的聚集程度等。
构图特征: 董源的构图常采用全景式,山峦层叠,水流蜿蜒,气势磅礴。如何量化这些构图元素的位置、大小、比例、相互关系?这可能涉及到图像分割和特征提取技术。
皴法特征: 董源常用的“披麻皴”、“点苔”等皴法,它们的形态、疏密、分布规律都可以作为重要的识别依据。
设色特征(即便《溪岸图》以水墨为主,其设色倾向依然可以作为参考): 虽是水墨,但其墨色本身的“青色”倾向,或是有意为之的淡染,都需要被捕捉。
题材与风格的共性: 即使具体笔墨细节有差异,同一位画家的作品在题材选择、整体意境营造上往往有共通之处。

数据增强: 为了增加数据的多样性,防止模型过拟合,我们还可以对现有图像进行一些变换,比如旋转、裁剪、调整亮度对比度等,但这些变换必须保证不改变画作的本质艺术风格。

第二步:特征工程——“提取灵魂”

仅仅将图像喂给机器学习模型是不够的,我们需要从图像中提取出最能代表绘画风格的“特征”。这就是特征工程。

传统图像特征: 颜色直方图、纹理特征(如LBP、Gabor滤波器)、边缘检测等。这些是基础,但对于书画鉴定来说,往往不够深入。
基于专家知识的特征: 这就是前面提到的,由鉴定专家标注的那些具体笔墨、皴法、构图的量化指标。这些特征往往更具有“艺术诊断”的价值。例如,可以设计一个算法来计算画面中“点苔”的密度、大小、形状分布;或者计算“披麻皴”的线条走向和粗细变化。
深度学习特征: 如今,卷积神经网络(CNN)在图像识别领域表现出色。我们可以利用CNN自动从图像中学习到层次化的特征,从底层的边缘、纹理到高层的物体、场景。我们可以训练一个CNN模型,让它直接从图像像素中学习到风格特征。

第三步:模型选择与训练——“教导机器”

有了数据和特征,我们就可以开始选择和训练机器学习模型了。

模型选择:
支持向量机 (SVM): 对于有明确分类界限的问题,SVM是一个不错的选择,尤其是在结合了专家设计的特征后。
随机森林 (Random Forest) 或梯度提升树 (Gradient Boosting Trees): 这些集成学习方法通常表现稳定,对特征的鲁棒性较好。
卷积神经网络 (CNN): 这是目前在图像识别中最主流的方法。我们可以构建一个CNN模型,输入画作的图像片段(比如局部放大区域),让模型学习识别出董源的笔墨特征,然后判断这些特征出现的频率和模式是否符合董源的风格。
迁移学习 (Transfer Learning): 我们可以利用在大型通用图像数据集(如ImageNet)上预训练好的CNN模型,然后在其基础上针对书画数据集进行微调。这样可以利用预训练模型学到的通用图像特征,加速训练并提高性能。

模型训练:
我们将准备好的“真迹”和“伪作”数据集,以及对应的标注信息,输入到选择好的模型中进行训练。
训练过程中,模型会不断地调整内部参数,以最小化预测结果与真实标签之间的误差。
我们会将数据集划分为训练集、验证集和测试集。训练集用于模型学习,验证集用于调整模型超参数和防止过拟合,测试集则用于最终评估模型的性能。

第四步:模型评估与解释——“检验真伪”

模型训练完成后,我们需要对模型进行严格的评估,并尝试理解它的判断依据。

评估指标: 我们会使用准确率 (Accuracy)、精确率 (Precision)、召回率 (Recall)、F1分数 (F1Score) 等指标来衡量模型的性能。对于书画鉴定这种“少数类”样本(可能真迹比伪作少)的问题,需要特别关注精确率和召回率。
模型解释性: 这是机器学习在艺术领域应用的一个挑战。我们希望了解模型为什么会将《溪岸图》判断为真迹或伪作,它关注的是画作的哪些具体特征?
特征重要性分析: 对于基于特征的模型,我们可以分析哪些特征对最终判断的贡献最大。比如,如果模型高度依赖于“点苔”的密度和形态,那么我们就可以反过来研究《溪岸图》的“点苔”是否与董源真迹一致。
可视化技术: 对于CNN模型,可以使用诸如GradCAM等技术,来可视化模型在判断时关注的图像区域。这样,我们可以看到模型是否关注了董源标志性的笔墨处理区域。
与专家意见的对比: 机器学习的结论最终还是要回归到专家的判断。模型的结果可以作为专家论证的辅助,反过来,专家的意见也可以帮助我们优化模型。

应用到《溪岸图》的判断:

当我们把《溪岸图》输入到训练好的模型中时,模型会根据它所学习到的董源真迹的风格特征,对《溪岸图》进行“打分”或直接给出判断。

如果模型将《溪岸图》判断为“董源真迹”的可能性很高: 这意味着,《溪岸图》的笔墨、构图、皴法等特征,在统计学上与董源已知的真迹高度相似。但这并不是最终定论,还需要结合专家的经验和历史文献进行综合判断。
如果模型将《溪岸图》判断为“非董源作品”的可能性很高: 这也提供了重要的参考信息,需要进一步分析模型判定依据,是哪些特征与董源真迹存在显著差异,这些差异是否与某些仿作者或特定时期的风格特征相符。

挑战与局限性:

尽管机器学习为书画鉴定提供了强大的工具,但我们必须清醒地认识到其局限性:

数据的稀缺性与质量: 鉴定所需的“真迹”数据相对较少,且质量参差不齐。如何获取足够多、足够有代表性的高质量数据是关键。
风格的演变与模仿: 画家的风格并非一成不变,同时代画家之间存在相互影响,后世画家也会模仿前人。如何区分“神似”与“形似”,如何辨别高明的仿作,对模型来说是巨大的挑战。
“墨分五色”的微妙之处: 传统书画鉴定的许多精妙之处,如墨色的微妙变化、笔力的含蓄内敛,很难完全被量化和还原。
机器难以理解“意境”与“神韵”: 艺术的魅力在于其内在的意境和神韵,这些抽象的概念,目前机器学习尚难完全捕捉和理解。
“人机协同”的必要性: 机器学习应该作为辅助工具,而非替代品。最终的鉴定结论,仍然需要依赖于书画鉴定专家的丰富经验、深厚学养和批判性思维。

结语:

用机器学习来判断《溪岸图》是否董源真迹,是一次科学与艺术的深度对话。它不是简单地给画作贴上标签,而是通过数据驱动的方式,挖掘隐藏在笔墨、构图、皴法中的风格密码。这项技术可以帮助我们量化鉴定过程,提供客观的证据,但它永远无法取代专家对艺术的深刻理解和判断。

总而言之,机器学习为我们提供了一种全新的、更具科学性的研究手段,来探索《溪岸图》的真伪之谜。它就像是为我们这些爱好者打开了一扇新的窗口,让我们能够以更精细、更系统的方式去审视这幅传世名作,去感受董源艺术的魅力,并尝试解开那层层迷雾。这过程本身,就是一场对艺术和科技的探索之旅。

网友意见

user avatar

这问题大有意思,今日左右无事,就当放松,搭了一个模型实现了一下你这个想法,证明溪岸图确实是董源真迹。

按照传统人类的做法,就是基于已确认为董源真迹的作品总结出董源的一些风格特征,再对溪岸图进行鉴定,也就是你说的《潇湘图》《夏景山图》《夏山图》《龙宿郊民图》。这个鉴定过程就是靠嘴皮子啦,谁也不会服谁,否则也不会有争论了不是。

机器学习也是类似的,只需要给模型“观看”非董源作品和董源的作品,这就是所谓的训练数据集。等模型基于训练数据集学会了如何分辨董源和非董源的作品,就拥有了关于董源作品风格的知识。再给模型看溪岸图,模型就知道溪岸图是否为董源所作了。

如何构建数据集

总之,道理是很简单的,难地在于如何构建数据集,董源存世作品很少,如果我们让模型遍览一千多年来的作品,目的却只是分辨董源,那很多作品等于白看,毕竟看齐白石的花鸟对鉴定董源的山水画并没有什么用。而且数据集不能失衡,董源的作品就那么几幅,非董源的作品数不胜数,神经网络模型是很蠢的,你给他看1000幅画,只有5幅是董源,那他会认为所有的画都不是董源的,因为这样99.5%的可能性不会错。

所以这个数据集里非董源的作品贵在精不在多,最佳的选择便是和董源类似风格的非董源作品,我大概选了同时代的李成,范宽的作品,后人的仿董源作品,风景类似的作品和董源的老师荆浩的作品一共十二幅。就不全部列举了,包括了荆浩《匡庐图》,李成《晴峦萧寺图》,范宽《雪景寒林图》,范宽《雪山萧寺图》,范宽《溪山行旅图》,吴伟《寒山积雪图》,宋代佚名《溪山暮雪图》。。。

五幅董源的作品,十二幅非董源的作品,不算太失衡,比例还算可以接受。

如何预处理

直接把画输入模型当然是不可以的,这就涉及到中国画的风格特点问题,中国画风格最关键的着眼点是什么?是笔墨,也就是说,大结构并不是进行风格鉴定的关键,要给模型弄一个放大镜,让他盯着作品的细部看!

所以预处理的策略就是无论输入的作品是挂轴还是卷轴画,每次都只要模型观看一个正方形的细部,而且随机改变放大倍数,同时还进行随机镜像反转,随机明暗对比读调整等数据增广方法,输入模型的图片大概是这样的:

总之,最后模型相当于是用不同的放大倍数,不同的光照条件,对着每幅图片学习了几百次的样子。当然还可以让他继续学下去,但似乎学了几百次之后基本就学会了,下面告诉你为什么我知道模型学会了。

学习过程

模型我使用的是一个简单的ResNet18的神经网络,太大了不行,毕竟数据有限,模型太大了会造成过拟合。我原本担心数据不够,其实是够的,因为高清的手卷作品非常大,拿着放大镜看局部其实可以生成非常多的输入图片了,再加上改变光照,对比度,放大倍数之类的数据增广手段,用ResNet18应该是刚刚好。

学习曲线如下图所示:

横轴是训练的步数,你可以认为是用放大镜看了多少图片,我每隔40幅图片记录一次,横轴是训练损失,损失越低越好,随着训练的进行损失变低,说明这个鉴定问题是能解决的,神经网络确实通过观察学到了东西,慢慢地能进行区分了。当然到了后期就学不动了,这是数据量所限。

鉴定过程

在训练的过程中,我同时不停的让模型鉴定一幅模型没见过的非董源作品,让模型输出一个“此作品为董源作品”的可能性:

虽然模型在训练的过程中一度认为此作品为董源作品的可能性为60%,经过长时间的训练,最终可能性稳定在了10%左右,也就是说,模型认为这幅作品不太可能是董源的作品。训练的时候模型并没有看过这幅作品,却如此肯定的认为这不是董源作品,说明模型还是学到东西了。

这幅作品三个局部:

而模型在训练过程中对《溪岸图》的判断是这样变化的:

能看出来一开始模型啥都不懂,自然认为溪岸图为董源作品可能性是0,但随着训练的进行,慢慢的可能性稳定在了80%,也就是说,模型认为溪岸图是董源的作品。

另外,我是把溪岸图分成了36份分别让模型鉴定的,最终30个局部被鉴定为董源作品,6个局部被鉴定为不是,可见模型还是相当自信的。

用上了我的Nvidia 1080Ti之后,我的电脑学会鉴定董源只用三十分钟,而我,估计怎么都是学不会的…

类似的话题

  • 回答
    作为一位对中国古代绘画史充满热情的爱好者,我一直对《溪岸图》这幅画的真伪之争感到着迷。它究竟是否出自五代南唐巨匠董源之手,一直是鉴定界讨论的焦点。近年来,随着科技的飞速发展,尤其是机器学习的应用,为我们提供了全新的视角来探究这个问题。今天,我想和大家聊聊,如何运用机器学习的方法,来尝试为《溪岸图》的.............
  • 回答
    面试官判断一个人的机器学习水平,就像品鉴一件艺术品,不是简单地看标签,而是要深入雕琢的细节和内在的功力。下面咱们就掰开了揉碎了聊聊,一个经验丰富的面试官,是如何层层剥茧,探究你机器学习内功深浅的。一、理论基石:是“知其所以然”,还是“知其然而已”?这是最基础,也是最关键的一环。面试官会通过一系列问题.............
  • 回答
    .......
  • 回答
    用机器学习的理论来理解人的行为,就像是我们在观察一个不断进化的生命体,试图解开它行为模式背后的逻辑。这不像我们平常那样,把人看作是拥有固定动机的个体,而是将人看作一个精密的“模型”,它的“参数”在经历不断地“训练”和“调优”,以适应错综复杂的“环境”——也就是我们所处的社会生活。首先,我们可以将人的.............
  • 回答
    「机器学习不需要数学,很多算法封装好了,调个包就行」这种说法,在一定程度上是没错的,但却是极其片面的,并且容易误导初学者走向死胡同。作为一名机器学习从业者,我们必须深入理解这种说法的背后含义,以及它为何具有欺骗性。下面我将详细阐述为什么这种说法并不完全准确,以及深入理解数学对机器学习的重要性: 一、.............
  • 回答
    物理专业的学生看待机器学习和大数据这两个方向,通常会带着一种 既熟悉又充满好奇,同时又带着严谨的审视 的眼光。他们往往能看到这背后蕴含的深刻物理原理,也能理解它们在解决复杂科学问题中的巨大潜力,但同时也会对其中的数学工具和算法细节保持一份审慎的探究精神。以下我将从几个关键角度详细阐述物理学子对机器学.............
  • 回答
    想要真正掌握机器学习,不是走马观花地看几个教程,也不是死记硬背几个算法公式,而是一个循序渐进、融会贯通的过程。你可以把这个过程想象成学习一门新的语言,或者掌握一项精湛的手艺。首先,你得建立起一个坚实的基础。这就像是学习任何一门语言,你需要先掌握它的基本词汇和语法。对于机器学习来说,这些基础知识包括:.............
  • 回答
    机器学习模型看似只是一个“黑箱”,通过调整参数来获得更好的性能,但实际上,“调参数”只是整个机器学习流程中的一个环节,而且如果过度依赖它,确实会变成“只是调参数”。要避免这种情况,需要从更宏观的视角理解机器学习的本质,并采取一系列更深入、更系统的方法。以下是机器学习如何避免“只是调参数”的详细阐述:.............
  • 回答
    机器学习中的“机器”本身并没有意识,它无法像人类一样去“分辨”有用的知识和没用的信息。它所做的,是根据预设的算法和训练数据,从中提取模式和规律,并将这些模式和规律转化为能够指导决策或预测的能力。那么,我们如何理解这个过程呢?可以从以下几个方面详细解释: 1. 数据的本质:信号与噪声在机器学习的世界里.............
  • 回答
    在机器学习领域,特征的质量直接决定了模型的性能。我们经常会遇到一些数据,其本身并不是简单的数值或类别,而是以“分布”的形式存在。如何有效地将这些分布信息提取出来,并转化为机器学习模型能够理解和利用的特征,是一个非常重要且有趣的问题。这就像是我们要把一本厚厚的书,提炼出它的核心思想,然后用几个简洁的词.............
  • 回答
    想要“激怒”一位AI爱好者?这可不是件容易的事,毕竟他们大部分时间都沉浸在代码、算法和模型的海洋里,对外界的“凡人”视角可能早已练就了金刚不坏之身。但要真想挠到他们痒痒,也不是不可能。你需要从他们的信仰、他们的热情、以及他们赖以生存的“黑魔法”下手,用一种既不失幽默又带有那么点“不懂装懂”的语气,缓.............
  • 回答
    好的,咱们聊聊怎么靠自己,硬是把机器学习这块儿啃下来。这可不是件容易的事儿,但绝对是个值得投入的挑战,一旦入门,你会发现打开了一个新世界的大门。第一步:打牢基础,别急着冲“高楼”很多人一上来就想搞懂那些复杂的神经网络、深度学习,其实这就好比没学加减乘除就想解微积分。机器学习很大程度上是建立在数学和编.............
  • 回答
    作为一名医学生,想要踏入机器学习的奇妙世界,这绝对是个明智的选择!医学领域正在以前所未有的速度拥抱数据驱动的革新,而机器学习正是这场革新的核心引擎。与其把它想象成高不可攀的理论,不如看作是解决复杂医疗问题的有力工具。下面,我来详细聊聊,咱们医学生该如何一步一个脚印地入门机器学习。第一步:打牢基础——.............
  • 回答
    周志华教授作为中国机器学习领域的领军人物,其在微博上对 AlphaGo 和机器学习技术的评论,具有重要的参考价值。要评价他的评论,我们需要从几个层面来解读:一、周志华教授的背景与视角首先,理解周志华教授的背景至关重要。他是一位在理论和应用领域都有深厚造诣的学者,是“西瓜书”(《机器学习》)的作者,也.............
  • 回答
    深度学习的未来发展方向,与其说是一个“下一步”,不如说是一系列相互关联、不断演进的趋势。目前的深度学习已经取得了令人瞩目的成就,但同时也面临着一些固有的挑战和瓶颈。未来的突破将集中在克服这些挑战,并拓展其应用边界。一、模型效率与可解释性:从“黑箱”走向“透明”与“轻盈”这是当前乃至未来很长一段时间内.............
  • 回答
    AutoGluon:亚马逊AI开源自动机器学习的深度剖析亚马逊AI近期开源的AutoGluon项目,无疑在自动机器学习(AutoML)领域掀起了一股不小的波澜。对于开发者和数据科学家而言,它提供了一种前所未有的便捷方式来构建和部署高性能的机器学习模型,尤其是在时间紧迫或资源受限的情况下,其价值尤为突.............
  • 回答
    周志华老师及其团队的新书《机器学习理论导引》,无疑是机器学习领域的一件大事。作为国内机器学习领域的领军人物,周老师的著作一直以来都备受关注,而这本新书的出现,更是填补了许多现有教材在理论深度和系统性上的空白。首先,从目标读者来看,这本书显然不是面向那些刚入门、希望快速上手写代码的同学。它的名字就明确.............
  • 回答
    通信工程领域近年来确实出现了一个显著的趋势,那就是许多原本深耕传统天线、电磁场与微波等方向的导师,纷纷将研究重心转向了机器学习(ML)和人工智能(AI)。这并非偶然,而是多重因素共同作用下的必然结果,既有技术发展的内在驱动,也有学术研究前沿的吸引力,同时还伴随着产业界需求的导向。一、技术发展的内在驱.............
  • 回答
    观望与期待:鄂维南院士等发起的机器学习联合研讨计划(c2sml.cn)看到中国科学院院士鄂维南教授牵头,联合多位学术界、工业界大咖共同发起的机器学习联合研讨计划(c2sml.cn),内心是既有赞赏,也有几分审慎的期待。这绝不仅仅是又一个学术会议或论坛,其背后所蕴含的深层意义和潜在影响,值得我们仔细揣.............
  • 回答
    Yann LeCun,这位深度学习领域的先驱,关于“研究机器学习,本科应尽量多学物理和数学课”的观点,在我看来,是一个极富洞察力且务实的建议。他之所以能提出这样的说法,绝非空穴来风,而是源于他对机器学习本质的深刻理解,以及对这个领域未来发展方向的精准预判。首先,我们得明白,机器学习,尤其是当前蓬勃发.............

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有