C++的运行时多态，性能损失有多大？

C++ 运行时多态：性能的代价与权衡

在 C++ 的世界里，我们常常惊叹于它的灵活性和表达力。其中，运行时多态（Runtime Polymorphism）是实现这一能力的关键机制之一，它允许我们在程序运行时根据对象的实际类型来决定调用哪个函数。这就像一个剧团的导演，在舞台上，他可以根据演员扮演的角色，准确地指挥演员做出相应的动作，而不是提前固定好所有动作。

然而，这种强大的灵活性并非没有代价。运行时多态在带来便利的同时，也伴随着一定的性能损耗。理解这些损耗的来源和程度，对于我们做出明智的设计决策至关重要。

运行时多态的实现机制：虚函数和虚表

要深入理解运行时多态的性能影响，我们首先需要了解它是如何实现的。在 C++ 中，运行时多态主要依赖于虚函数（virtual functions）和虚表（vtable）。

当一个类声明了虚函数，并且其派生类也重写了这些虚函数时，编译器会在该类中生成一个隐藏的指针，称为虚函数指针（vptr）。这个虚函数指针指向该类特有的虚函数表（vtable）。虚函数表是一张表，存储了该类所有虚函数的地址。

当通过基类指针或引用调用一个虚函数时，程序会在运行时查找这个虚函数指针，然后根据虚函数指针找到对应的虚函数表，并从中取出该虚函数的地址来执行。

举个例子：

```c++
class Base {
public:
virtual void func1() { / ... / }
virtual void func2() { / ... / }
void nonVirtualFunc() { / ... / }
};

class Derived : public Base {
public:
void func1() override { / ... / } // 重写虚函数
void func2_again() { / ... / } // 派生类特有函数
};
```

在这个例子中，`Base` 类中的 `func1` 和 `func2` 是虚函数。`Derived` 类继承了 `Base`，并重写了 `func1`。

`Base` 对象内部会有一个指向 `Base` 类虚函数表的指针。
`Derived` 对象内部会有一个指向 `Derived` 类虚函数表的指针。`Derived` 的虚函数表会包含 `Base` 的虚函数地址（如果未被重写，则指向基类的实现），以及自己重写的 `func1` 的地址。

性能损耗的来源

现在，我们来剖析一下运行时多态带来的性能损耗主要体现在哪些方面：

1. 虚函数调用开销（Virtual Call Overhead）：
两次间接跳转：当通过基类指针调用虚函数时，程序需要先通过对象的隐藏的虚函数指针找到对应的虚函数表，然后再从虚函数表中找到正确的函数地址进行跳转。这比直接调用非虚函数（一次直接跳转）多了一次额外的间接跳转。
查找过程：虽然虚函数表是一个数组，查找过程相对较快，但与直接函数调用相比，仍然存在查找的开销。

2. 内存开销（Memory Overhead）：
虚函数指针的存储：每个包含虚函数的类（以及其派生类）的对象都需要额外存储一个虚函数指针。虽然一个指针的大小通常不大（取决于平台，可能是4或8字节），但如果一个程序有大量的对象，这个内存开销累积起来也是不可忽视的。
虚函数表的存储：每个类（即使是抽象基类）也会生成一个虚函数表。这意味着每个类都会占用一定的内存来存储其虚函数表。

3. 缓存局部性（Cache Locality）：
虚函数表可能不在对象附近：虚函数表是与类关联的，并不直接存储在对象内部（只有一个指针）。当程序需要查找虚函数表时，可能需要从内存中加载虚函数表，这可能会导致缓存未命中（cache miss），从而引入延迟。
函数地址分散：通过虚函数表调用函数，函数地址可能分布在内存的不同区域，不像通过 vtable 调用的时候，函数的地址会分散在各个 vtable 里，这样对 CPU 的缓存就不是很友好。

4. 编译时优化的限制（Limited CompileTime Optimizations）：
内联优化受阻：编译器通常会优先考虑对非虚函数进行内联（inlining）优化。这是因为编译器在编译时就能确定非虚函数的具体实现，可以直接将函数体插入到调用点，从而消除函数调用的开销。然而，对于虚函数，编译器在编译时无法确定具体调用哪个派生类的函数，因此很难对其进行有效的内联。虽然现代编译器在某些情况下（例如通过某些技巧或在已知对象类型时）可能对虚函数进行内联，但这远不如对非虚函数那样普遍和高效。
其他优化受限：其他一些依赖于函数具体实现的编译器优化，例如常量折叠、循环展开等，在遇到虚函数时也可能受到限制。

性能损失有多大？量化评估

精确地量化运行时多态的性能损耗是困难的，因为它受到多种因素的影响，包括：

程序的整体结构和调用模式：一个频繁调用虚函数的程序，其性能损耗会比一个很少使用虚函数的程序更明显。
虚函数的数量和复杂度：虚函数本身执行的代码越简单，函数调用开销在总执行时间中的占比就越高。
编译器和编译选项：不同的编译器对虚函数的优化程度不同，开启不同的优化选项也会影响性能。
硬件架构和缓存机制：CPU 的缓存大小、预取机制等都会影响间接跳转的成本。
函数调用的频率：如果一个函数被调用得非常频繁，哪怕是很小的函数调用开销，累积起来也会非常显著。

然而，我们可以给出一些普遍的估计和经验法则：

函数调用开销的增加：相对于直接函数调用，一次虚函数调用可能带来 1030 倍甚至更多的开销。这主要是因为上面提到的两次间接跳转和查找过程。请注意，这个数字是一个非常粗略的估计，具体情况差异很大。
内存使用增加：每个支持多态的对象都会增加大约一个指针的内存开销。对于大量对象而言，这可能导致显著的内存增长。
实际应用中的影响：在许多应用场景中，这种损耗可能并不明显，特别是在虚函数调用不是性能瓶颈的情况下，或者虚函数的实现本身需要大量计算时，函数本身的计算开销会掩盖掉函数调用带来的额外开销。
极端情况的性能影响：但在一些对性能要求极高的场景，例如游戏引擎的渲染管线、高性能计算库等，每一次函数调用都至关重要，那么虚函数调用带来的开销就可能成为一个严重的瓶颈。

举个具体的例子来辅助理解：

假设我们有一个场景，需要在一个循环中对 100 万个对象执行一个简单的操作，这个操作被封装在一个虚函数里。

非虚函数调用：每次调用，可能只需要几十个 CPU 周期（取决于函数本身复杂度）。
虚函数调用：可能需要几百个甚至上千个 CPU 周期（包括查找 vtable、间接跳转等）。

即使每个虚函数调用只比非虚函数调用慢 100 个周期，累积起来就是 100 万 100 = 1 亿个周期的额外开销。如果一个 CPU 的时钟频率是 3GHz（每秒 30 亿个周期），那么这 1 亿个周期的额外开销就可能花费近 33 毫秒。如果这个操作是这个程序的主要计算负担，那么这个性能损失将是非常可观的。

如何权衡？

理解了性能损耗的来源和程度，我们就可以在设计中做出更明智的权衡：

1. 何时可以使用运行时多态？
当我们需要在运行时根据对象的实际类型来执行不同的行为时。
当需要实现面向接口编程（Programming to an interface）时。
当需要设计可扩展性强、易于维护的系统时，运行时多态是实现这些目标的重要工具。

2. 何时应考虑避免或减少运行时多态？
性能关键路径：如果某个部分的代码是程序的性能瓶颈，并且其性能高度依赖于函数调用速度，那么应谨慎使用虚函数。
少量对象，频繁操作：如果操作的对象数量不多，但每次操作都非常频繁，那么虚函数调用的累积开销可能会很明显。
编译器已知类型：如果在某个上下文环境中，编译器已经确切地知道对象的实际类型（例如，在一个专门处理某一派生类对象的函数中），那么就可以考虑使用静态分派（直接函数调用），甚至 cast 到派生类指针来调用非虚函数。

3. 替代方案和优化技巧
模板（Templates）与静态多态（Static Polymorphism）：模板允许在编译时根据类型参数生成不同的代码，从而实现多态行为，但这是静态多态。静态多态的性能优势在于它避免了运行时查找，通常可以进行内联优化，并且没有虚函数指针的内存开销。
`std::function` 和 Lambda 表达式：在某些场景下，可以使用 `std::function` 来存储函数对象（包括 lambda），并对其进行调用。 `std::function` 内部也可能涉及额外的间接跳转，但其灵活性有时能弥补性能上的微小损失，并且它比虚函数更通用，可以存储非成员函数、成员函数指针等。
策略模式（Strategy Pattern）结合模板或枚举：对于数量有限的、已知的行为，可以使用模板来选择不同的策略实现，或者使用枚举来区分不同的行为，然后通过 `switch` 语句或查找表来调用相应的函数。
成员函数指针（Member Function Pointers）：对于类成员函数，可以使用成员函数指针，但调用成员函数指针也需要一个额外的间接跳转，而且需要绑定对象。
极致优化：避免虚函数：在某些极端的性能敏感场景，如果可以接受代码复杂度的增加，可以尝试完全避免虚函数，通过其他方式（例如使用大量模板和条件编译）来实现。

结论：没有免费的午餐

C++ 的运行时多态是一个非常强大的特性，它为我们提供了极大的灵活性和抽象能力。然而，这种灵活性是以一定的性能为代价的。理解虚函数调用、虚表以及它们带来的间接跳转、内存开销和对编译器优化的限制，是做出正确设计决策的关键。

在绝大多数情况下，运行时多态带来的性能损耗是可以接受的，甚至对于代码的可维护性和可扩展性来说是值得的。但是，当我们面对性能至关重要的场景时，需要审慎评估使用虚函数的必要性，并考虑使用静态多态（如模板）或其他替代方案来优化性能。

作为开发者，我们的目标是在代码的灵活性、可读性、可维护性以及性能之间找到最佳的平衡点。运行时多态是 C++ 语言提供的一种强大的工具，但如何使用它，以及何时不使用它，取决于我们对具体需求的理解和对性能的考量。

网友意见

你这种情况没必要多态，最好是纯 c 的 api，然后不同的实现，都做成独立的库去实现这组 api 就行了。

如果要精简存储空间，那就用静态库，在编译时指定链接哪个，但这就没办法运行时切换。

如果不在乎存储空间，就做成动态库，运行时可以根据实际情况加载。

类似的话题

C++的运行时多态，性能损失有多大？

C++ 运行时多态：性能的代价与权衡在 C++ 的世界里，我们常常惊叹于它的灵活性和表达力。其中，运行时多态（Runtime Polymorphism）是实现这一能力的关键机制之一，它允许我们在程序运行时根据对象的实际类型来决定调用哪个函数。这就像一个剧团的导演，在舞台上，他可以根据演员扮演的角色，.............
一般编程的时候，使用汇编能比使用高级语言（比如C，C++，java等）有更高的运行效率吗？高能高出多少呢？

关于汇编语言与高级语言在运行效率上的对比，这是一个老生常谈但又非常值得探讨的话题。简单来说，在某些特定情况下，汇编确实能够比高级语言获得更高的运行效率，但这种优势的幅度并非绝对，并且随着技术的发展和编译器优化的进步，差距正在逐渐缩小。要详细讲清楚这个问题，咱们得从几个层面来剖析：一、为什么汇编“理.............
如果 C# 当年设计成一个彻底编译到机器码的但有运行时的 AOT 语言，能不能真的拿来代替 C++？

这个问题很有意思，也触及了 C 语言设计哲学与 C++ 语言在系统编程领域的主导地位之间的根本矛盾。如果 C 当初就被设计成“纯粹的 AOT 编译、拥有运行时”的语言，它能否真正取代 C++？要回答这个问题，咱们得拆开来看，从几个关键维度去审视。一、什么是“彻底编译到机器码”但“有运行时”？首先，.............
C++ 运动完上一个函数到下一个函数时，上一个函数里的变量值（结构体变量）为什么没保留住，变成零了？

你遇到的这个问题，在 C++ 中是一个非常经典且常见的情况，尤其对于初学者来说。究其原因，主要在于 C++ 的作用域（Scope）和变量的生命周期（Lifetime）。简单来说，当一个函数执行完毕，它所定义的所有局部变量，包括你的结构体变量，都会随着函数的结束而被销毁，其占用的内存空间也会被释放。当.............
c语言while语句他是怎么工作怎么运行的?

C语言的`while`循环，说白了，就是一种“当…就一直做”的执行方式。它就像你家里那个总是在提醒你该出门的闹钟，只要设定的条件还没到，它就没完没了地响，直到你满足了某个条件（比如按下贪睡按钮或者起床）。咱们一步步拆解它怎么工作的：1. 基本结构`while`循环的写法很简单，就像这样：```cwh.............
PPP运行方式和BOT、EPC+C模式的对比区别？

好的，咱们就来好好聊聊PPP、BOT以及EPC+C这几种工程项目运作模式，把它们之间的区别和联系讲透。这几种模式在基础设施建设领域都挺常见，各有千秋。 PPP模式：伙伴关系的艺术PPP，全称是PublicPrivate Partnership，中文翻译过来就是“政府和社会资本合作”。顾名思义，这是政.............
2 C 和 2 B 的运营有什么区别？

2C 和 2B 的运营，虽然都是围绕着“运营”二字展开，但它们的核心目标、用户画像、触达方式、转化路径，乃至整个运营逻辑，都存在着天壤之别。简单来说，2C 是做给“个人”的生意，而 2B 则是做给“企业”的生意。下面咱们就掰开了揉碎了，详细聊聊这其中的区别。一、根本目标：情感满足 vs. 价值驱动.............
下列运动物体中，平均速度有可能为20m/s的是（　　）A．正在快速爬行的蚂蚁B．在平直公路上行驶的汽车C．

.......
动物在发展进化中,产生最晚的系统是什么（A排泄，B呼吸，C循环，D运动）？

在生命的漫长演进过程中，动物们为了适应不断变化的环境，发展出了形形色色的系统。从最基础的维持生命活动到复杂的高效运作，每一个系统的出现都标志着生命一次重要的飞跃。那么，在排泄、呼吸、循环和运动这几个关键系统中，哪一个的产生是最晚的呢？要想弄清楚这个问题，我们得把时间的长河拉得很长很长，回到生命的最初.............
C++的模版，到底是功能强大的工具，还是荒谬拙劣的小伎俩?

C++ 模板：功能强大的工具还是荒谬拙劣的小伎俩？C++ 模板无疑是 C++ 语言中最具争议但也最引人注目的一项特性。它既能被誉为“代码生成器”、“通用编程”的基石，又可能被指责为“编译时地狱”、“难以理解”的“魔法”。究竟 C++ 模板是功能强大的工具，还是荒谬拙劣的小伎俩？这需要我们深入剖析它的.............
C++的优势有哪些？

C++ 是一门强大而灵活的编程语言，它继承了 C 语言的高效和底层控制能力，同时引入了面向对象、泛型编程等高级特性，使其在各种领域都得到了广泛应用。下面我将尽可能详细地阐述 C++ 的主要优势： C++ 的核心优势：1. 高性能和底层控制能力 (Performance and LowLevel C.............
C++的核心究竟是什么？学到什么程度才算精通？

C++ 的核心以及“精通”的程度，这是一个非常值得深入探讨的话题。让我尽量详细地为您解答。 C++ 的核心究竟是什么？C++ 的核心是一个多层次的概念，可以从不同的角度来理解。我将尝试从以下几个方面来阐述：1. 语言设计的哲学与目标： C 的超集与面向对象扩展： C++ 最初的目标是成为 C 语.............
C++ 的什么是 Java 不能取代的？

C++ 和 Java 都是非常流行且强大的编程语言，它们各有优劣，并在不同的领域发挥着重要作用。虽然 Java 在很多方面都非常出色，并且在某些领域已经取代了 C++，但仍然有一些 C++ 的独特之处是 Java 无法完全取代的，或者说取代的成本非常高。以下是 C++ 的一些 Java 不能（或难以.............
C++的new操作符，底层使用的是malloc吗，在析构时，是如何确定自己需要释放内存的大小的？

C++ `new` 操作符与 `malloc`：底层联系与内存管理奥秘在C++中，`new` 操作符是用于动态分配内存和调用构造函数的关键机制。许多开发者会好奇 `new` 操作符的底层实现，以及它与C语言中的 `malloc` 函数之间的关系。同时，在对象生命周期结束时，`delete` 操作符是.............
c++的单例模式为什么不直接全部使用static，而是非要实例化一个对象？

好，咱们来聊聊 C++ 单例模式里那个“为什么要实例化一个对象，而不是直接把所有成员都 `static`”的疑问。这确实是很多初学者都会纠结的地方，感觉直接用 `static` 更省事。但这里面涉及到 C++ 的一些核心概念和设计上的考量，咱们一点点掰开了说。先明确一下单例模式的目标在深入“`st.............
C++ 的 string 为什么不提供 split 函数？

在 C++ 标准库的 `std::string` 类设计之初，确实没有提供一个直接的 `split` 函数。这与其他一些高级语言（如 Python、Java）中普遍存在的 `split` 方法有所不同。要理解为什么会这样，我们需要深入探究 C++ 的设计哲学、标准库的演进过程以及当时的开发环境和需求.............
C# 的扩展方法是否是一个糟糕的设计？

C 扩展方法：一把双刃剑C 的扩展方法，顾名思义，允许我们为现有的类型添加新的方法，而无需修改原始类型的源代码。这种能力最初听起来像是魔法，能够让代码更加优雅、富有表现力，并且提升了代码的复用性。然而，正如许多强大的工具一样，扩展方法也是一把双刃剑，如果使用不当，可能会导致代码可读性下降、维护困难，.............
c++的list什么时候用？

C++ 的 `std::list`，作为 STL（Standard Template Library）中的一员，它是一种双向链表（doubly linked list）。它的核心特点在于，每个节点都存储了数据本身，以及指向前一个节点和后一个节点的指针。这使得 `std::list` 在某些特定场景下.............
C++ 的智能指针不就基本解决了野指针问题了吗?为什么还要吹捧rust的内存安全?

你问了一个非常关键的问题，而且问得非常实在。确实，C++ 的智能指针，尤其是 `std::unique_ptr` 和 `std::shared_ptr`，在很大程度上解决了 C++ 中常见的野指针和内存泄漏问题。这玩意儿在 C++ 世界里，堪称“救世主”般的存在。那么，为什么大家对 Rust 的内存.............
C++ 的常量后缀在什么情况下使用？

C++ 中的常量后缀，顾名思义，就是用来标识字面量（literal）是何种类型的。虽然编译器通常能够通过字面量的形式推断出其类型，但在很多情况下，使用常量后缀能够明确表达开发者的意图，避免潜在的类型转换问题，并提升代码的可读性和健壮性。我们来详细探讨一下常量后缀在哪些情况下特别有用，并说明其背后的原.............