本文最后更新于2024-10-26，距今已有 595 天，若文章内容或图片链接失效，请留言反馈。

34_「C++11」lambda 表达式

C嘎嘎

「前言」文章的大致内容是 lambda 表达式。

lambda表达式

1.1 lambda 表达式出现的原因

在 C++98 中，如果想要对一个数据集合中的元素进行排序，可以使用 std::sort 方法。

测试代码

#include <algorithm>
#include <iostream>
int main()
{
	int array[] = { 4,1,8,5,3,7,0,9,2,6 };

	// 默认按照小于比较，排出来结果是升序
	std::sort(array, array + sizeof(array) / sizeof(array[0]));

	// 如果需要降序，需要改变元素的比较规则
	std::sort(array, array + sizeof(array) / sizeof(array[0]), greater<int>());

	return 0;
}

如果待排序元素为自定义类型，需要用户定义排序时的比较规则：

要控制 sort 函数的比较方式常见的有两种方法，一种是对商品类的的()运算符进行重载，另一种是通过仿函数来指定比较的方式。
在这里显然通过重载商品类的()运算符是不可行的，因为这里要求分别按照价格和数量进行升序、降序排序，每次排序就去修改一下比较方式是很不好的做法。
所以这里选择传入仿函数来指定排序时的比较方式。
注：仿函数的出现是为了替代C语言中的指针。

但是仿函数给代码降低了可读性，每次还需重新写一个类，仿函数在这种场景下也不是特别好用。

struct Goods
{
	string _name; // 名字
	double _price; // 价格
	int _evaluate; // 评价
	Goods(const char* str, double price, int evaluate)
		:_name(str)
		, _price(price)
		, _evaluate(evaluate)
	{}
};
//价格升序
struct ComparePriceLess
{
	bool operator()(const Goods& gl, const Goods& gr)
	{
		return gl._price < gr._price;
	}
};
//价格降序
struct ComparePriceGreater
{
	bool operator()(const Goods& gl, const Goods& gr)
	{
		return gl._price > gr._price;
	}
};
int main()
{
	vector<Goods> v = { { "苹果", 2.1, 5 }, { "香蕉", 3, 4 }, { "橙子", 2.2, 3 }, { "菠萝", 1.5, 4 } };

	sort(v.begin(), v.end(), ComparePriceLess());//价格升序
	sort(v.begin(), v.end(), ComparePriceGreater());//价格降序
}

随着C++语法的发展，人们开始觉得上面的写法太复杂了，每次为了实现一个 algorithm 算法，都要重新去写一个类，如果每次比较的逻辑不一样，还要去实现多个类，特别是相同类的命名，这些都给编程者带来了极大的不便。

因此，在 C++11 语法中出现了 Lambda 表达式。

1.2 lambda 表达式语法

lambda 表达式是一个匿名函数，恰当使用 lambda 表达式可以让代码变得简洁，并且可以提高代码的可读性。

lambda 表达式书写格式：

[capture-list] (parameters) mutable -> return-type { statement}

lambda表达式各部分说明：

[capture-list] : 捕捉列表，该列表总是出现在 lambda 函数的开始位置，编译器根据 [] 来判断接下来的代码是否为 lambda 函数，捕捉列表能够捕捉上下文中的变量供 lambda函数使用。
(parameters)：参数列表。与普通函数的参数列表一致，如果不需要参数传递，则可以连同 () 一起省略。
mutable：默认情况下，lambda 函数总是一个 const 函数，mutable 可以取消其常量性。使用该修饰符时，参数列表不可省略(即使参数为空)。
->returntype：返回值类型。用追踪返回类型形式声明函数的返回值类型，没有返回值时此部分可省略。返回值类型明确情况下，也可省略，由编译器对返回类型进行推导。
{statement}：函数体。在该函数体内，除了可以使用其参数外，还可以使用所有捕获到的变量。

注意：在 lambda 函数定义中，参数列表和返回值类型都是可选部分，而捕捉列表和函数体可以为空。但是捕捉列表和函数体必须要有，即使为空。

因此 C++11 中最简单的 lambda 函数为：[]{}，该 lambda 函数不能做任何事情。

int main()
{
	// 最简单的lambda表达式, 该lambda表达式没有任何意义
	[] {};
	return 0;
}

捕获列表说明

捕捉列表描述了上下文中那些数据可以被 lambda 使用，以及使用的方式传值还是传引用。

[var]：表示值传递方式捕捉变量var。
[=]：表示值传递方式捕获所有父作用域中的变量(包括this)。
[&var]：表示引用传递捕捉变量var。
[&]：表示引用传递捕捉所有父作用域中的变量(包括this)。
[this]：表示值传递方式捕捉当前的this指针。

lambda表达式实际上可以理解为无名函数，该函数无法直接调用，如果想要直接调用，可借助 auto 将其赋值给一个变量

测试代码

int main()
{
	// 省略参数列表和返回值类型，返回值类型由编译器推导为int
	int a = 3, b = 4;
	[=] { return a + 3; };

	//省略了返回值类型，无返回值类型
	auto fun1 = [&](int c) { b = a + c; };
	fun1(10);
	cout << a << " " << b << endl;

	// 各部分都很完善的lambda函数
	auto fun2 = [=, &b](int c)->int { return b += a + c; };
	cout << fun2(10) << endl;

	// 复制捕捉x
	int x = 10;
	auto add_x = [x](int a) mutable { x *= 2; return a + x; };
	cout << add_x(10) << endl;

	return 0;
}

运行结果

3 13
26
30

注意：

父作用域指包含 lambda 函数的语句块。
语法上捕捉列表可由多个捕捉项组成，并以逗号分割。比如：[=, &a, &b]：以引用传递的方式捕捉变量a和b，值传递方式捕捉其他所有变量 [&，a, this]：值传递方式捕捉变量a和this，引用方式捕捉其他变量。
捕捉列表不允许变量重复传递，否则就会导致编译错误。比如：[=, a]：=已经以值传递方式捕捉了所有变量，捕捉a重复。
在块作用域以外的lambda函数捕捉列表必须为空。
在块作用域中的lambda函数仅能捕捉父作用域中局部变量，捕捉任何非此作用域或者非局部变量都会导致编译报错。
lambda表达式之间不能相互赋值，即使看起来类型相同。

所以，在 1.1 中的例子可以使用 lambda表达式，代码如下：

int main()
{
	vector<Goods> v = { { "苹果", 2.1, 5 }, { "香蕉", 3, 4 }, { "橙子", 2.2, 3 }, { "菠萝", 1.5, 4 } };
	//价格升序
	sort(v.begin(), v.end(), [](const Goods& g1, const Goods& g2) {
		return g1._price < g2._price; });
	//价格降序
	sort(v.begin(), v.end(), [](const Goods& g1, const Goods& g2) {
		return g1._price > g2._price; });
	//评价升序
	sort(v.begin(), v.end(), [](const Goods& g1, const Goods& g2) {
		return g1._evaluate < g2._evaluate; });
	//评价降序
	sort(v.begin(), v.end(), [](const Goods& g1, const Goods& g2) {
		return g1._evaluate > g2._evaluate; });

	return 0;
}

1.3 函数对象与 lambda 表达式

函数对象，又称为仿函数，即可以像函数一样使用的对象，就是在类中重载了 operator() 运算符的类对象。

实际编译器在底层对于 lambda 表达式的处理方式，完全就是按照函数对象的方式处理的，即 lambda 表达式的底层就是仿函数。

测试代码：

编写了一个 Rate的类，该类对（）运算符进行了重载，因此Rate类实例化出的 r1 对象就叫做函数对象，r1 可以像函数一样使用。然后编写一个 lambda 表达式，并借助 auto 将其赋值给 r2 对象，这时 r1 和 r2 都可以像普通函数一样使用，这个仿函数和 lamdba表达式的功能完全一致。

class Rate
{
public:
	Rate(double rate) 
		: _rate(rate)
	{}

	double operator()(double money, int year)
	{
		return money * _rate * year;
	}
private:
	double _rate;
};

int main()
{
	// 函数对象(仿函数)
	double rate = 0.49;
	Rate r1(rate);
	r1(10000, 2);

	// lambda
	auto r2 = [=](double monty, int year)->double {return monty * rate * year;};
	r2(10000, 2);

	return 0;
}

在调试模式下转到反汇编

r1 对象会先调用 Rate类的构造函数（ Rate::Rate (0C513A7h)），然后 r1 才调用 Rate类的（）运算符重载函数（Rate::operator() (0C511B8h)），汇编代码如下：

观察lambda表达式时，也能看到类似的汇编代码。

仿函数的汇编代码和 lambda表达式进行比较（图中圈起来的地方），比较发现，仿函数和lambda表达式的调用函数的汇编代码几乎一致，除了类名不相同。

从图中可以看出，lambda表达式的底层被转换成了仿函数，所以 lambda 表达式的本质上就是仿函数。

实际上当我们定义一个lambda表达式后，编译器会自动生成一个类，在该类中对 ()运算符进行重载，实际 lambda函数体的实现就是这个仿函数的 operator()的实现。
在调用 lambda表达式时，参数列表和捕获列表的参数，最终都传递给了仿函数的 operator()。

该类的名字是编译器随机生成的，该类名只有编译器可以认识，这也是我们为什么要借助 auto 将其赋值给一个变量的原因。

解释上面 lambda表达式之间不能相互赋值的原因。

因为lambda表达式底层的处理方式和仿函数是一样的，在VS下，lambda 表达式在底层会被处理为函数对象，该函数对象对应的类名叫做 <lambda_uuid>。
类名中的 uuid 叫做通用唯一识别码（Universally Unique Identifier），简单来说，uuid 就是通过算法生成一串字符串，保证在当前程序当中每次生成的 uuid 都不会重复。
lambda 表达式底层的类名包含 uuid，这样就能保证每个 lambda 表达式底层类名都是唯一的。

因此每个 lambda 表达式的类型都是不同的，这也就是 lambda 表达式之间不能相互赋值的原因，我们可以通过 typeid(变量名).name() 的方式来获取lambda表达式的类型。

int main()
{
	auto f1 = [] {cout << "hello world" << endl; };
	auto f2 = [] {cout << "hello world" << endl; };

	cout << typeid(f1).name() << endl; 
	cout << typeid(f2).name() << endl;

	return 0;
}

运行结果，可以看到，就算是两个一模一样的 lambda 表达式，它们的类型都是不同的。

--------------- END ---------------

「 作者 」 枫叶先生
「 更新 」 2023.4.19
「 声明 」 余之才疏学浅，故所撰文疏漏难免，
          或有谬误或不准确之处，敬请读者批评指正。

如果觉得文章对你有用，请随意赞赏

34_「C++11」lambda 表达式

http://114.132.213.38:6250/archives/bb04961c-f0ad-4fee-96ea-afbc3fc49f60

作者

枫叶先生的网络日志

发布于

2024-10-26

更新于

2024-10-26

许可协议

CC BY 4.0

34_「C++11」lambda 表达式

lambda表达式

1.1 lambda 表达式出现的原因

1.2 lambda 表达式语法

1.3 函数对象与 lambda 表达式

作者

发布于

更新于

许可协议

评论