「前言」文章的大致内容是 lambda 表达式。

lambda表达式

1.1 lambda 表达式出现的原因

在 C++98 中,如果想要对一个数据集合中的元素进行排序,可以使用 std::sort 方法。

测试代码

#include <algorithm>
#include <iostream>
int main()
{
	int array[] = { 4,1,8,5,3,7,0,9,2,6 };

	// 默认按照小于比较,排出来结果是升序
	std::sort(array, array + sizeof(array) / sizeof(array[0]));

	// 如果需要降序,需要改变元素的比较规则
	std::sort(array, array + sizeof(array) / sizeof(array[0]), greater<int>());

	return 0;
}

如果待排序元素为自定义类型,需要用户定义排序时的比较规则:

  • 要控制 sort 函数的比较方式常见的有两种方法,一种是对商品类的的()运算符进行重载,另一种是通过仿函数来指定比较的方式。
  • 在这里显然通过重载商品类的()运算符是不可行的,因为这里要求分别按照价格和数量进行升序、降序排序,每次排序就去修改一下比较方式是很不好的做法。
  • 所以这里选择传入仿函数来指定排序时的比较方式。
  • 注:仿函数的出现是为了替代C语言中的指针。

但是仿函数给代码降低了可读性,每次还需重新写一个类,仿函数在这种场景下也不是特别好用。

struct Goods
{
	string _name; // 名字
	double _price; // 价格
	int _evaluate; // 评价
	Goods(const char* str, double price, int evaluate)
		:_name(str)
		, _price(price)
		, _evaluate(evaluate)
	{}
};
//价格升序
struct ComparePriceLess
{
	bool operator()(const Goods& gl, const Goods& gr)
	{
		return gl._price < gr._price;
	}
};
//价格降序
struct ComparePriceGreater
{
	bool operator()(const Goods& gl, const Goods& gr)
	{
		return gl._price > gr._price;
	}
};
int main()
{
	vector<Goods> v = { { "苹果", 2.1, 5 }, { "香蕉", 3, 4 }, { "橙子", 2.2, 3 }, { "菠萝", 1.5, 4 } };

	sort(v.begin(), v.end(), ComparePriceLess());//价格升序
	sort(v.begin(), v.end(), ComparePriceGreater());//价格降序
}

随着C++语法的发展,人们开始觉得上面的写法太复杂了,每次为了实现一个 algorithm 算法,都要重新去写一个类,如果每次比较的逻辑不一样,还要去实现多个类,特别是相同类的命名,这些都给编程者带来了极大的不便。

因此,在 C++11 语法中出现了 Lambda 表达式。

1.2 lambda 表达式语法

lambda 表达式是一个匿名函数,恰当使用 lambda 表达式可以让代码变得简洁,并且可以提高代码的可读性。

lambda 表达式书写格式

[capture-list] (parameters) mutable -> return-type { statement}

lambda表达式各部分说明: 

  • [capture-list] : 捕捉列表,该列表总是出现在 lambda 函数的开始位置,编译器根据 [] 来判断接下来的代码是否为 lambda 函数,捕捉列表能够捕捉上下文中的变量供 lambda函数使用。
  • (parameters):参数列表。与普通函数的参数列表一致,如果不需要参数传递,则可以连同 () 一起省略。
  • mutable:默认情况下,lambda 函数总是一个 const 函数,mutable 可以取消其常量性。使用该修饰符时,参数列表不可省略(即使参数为空)。
  • ->returntype:返回值类型。用追踪返回类型形式声明函数的返回值类型,没有返回值时此部分可省略。返回值类型明确情况下,也可省略,由编译器对返回类型进行推导。
  • {statement}:函数体。在该函数体内,除了可以使用其参数外,还可以使用所有捕获到的变量。

注意:在 lambda 函数定义中,参数列表和返回值类型都是可选部分,而捕捉列表和函数体可以为空。但是捕捉列表和函数体必须要有,即使为空。

因此 C++11 中最简单的 lambda 函数为:[]{},该 lambda 函数不能做任何事情。

int main()
{
	// 最简单的lambda表达式, 该lambda表达式没有任何意义
	[] {};
	return 0;
}

捕获列表说明

捕捉列表描述了上下文中那些数据可以被 lambda 使用,以及使用的方式传值还是传引用。

  • [var]:表示值传递方式捕捉变量var。
  • [=]:表示值传递方式捕获所有父作用域中的变量(包括this)。
  • [&var]:表示引用传递捕捉变量var。
  • [&]:表示引用传递捕捉所有父作用域中的变量(包括this)。
  • [this]:表示值传递方式捕捉当前的this指针。

lambda表达式实际上可以理解为无名函数,该函数无法直接调用,如果想要直接调用,可借助 auto 将其赋值给一个变量 

测试代码

int main()
{
	// 省略参数列表和返回值类型,返回值类型由编译器推导为int
	int a = 3, b = 4;
	[=] { return a + 3; };

	//省略了返回值类型,无返回值类型
	auto fun1 = [&](int c) { b = a + c; };
	fun1(10);
	cout << a << " " << b << endl;

	// 各部分都很完善的lambda函数
	auto fun2 = [=, &b](int c)->int { return b += a + c; };
	cout << fun2(10) << endl;

	// 复制捕捉x
	int x = 10;
	auto add_x = [x](int a) mutable { x *= 2; return a + x; };
	cout << add_x(10) << endl;

	return 0;
}

 运行结果

3 13
26
30

注意:

  • 父作用域指包含 lambda 函数的语句块。
  • 语法上捕捉列表可由多个捕捉项组成,并以逗号分割。比如:[=, &a, &b]:以引用传递的方式捕捉变量a和b,值传递方式捕捉其他所有变量 [&,a, this]:值传递方式捕捉变量a和this,引用方式捕捉其他变量。
  • 捕捉列表不允许变量重复传递,否则就会导致编译错误。比如:[=, a]:=已经以值传递方式捕捉了所有变量,捕捉a重复。
  • 在块作用域以外的lambda函数捕捉列表必须为空。
  • 在块作用域中的lambda函数仅能捕捉父作用域中局部变量,捕捉任何非此作用域或者非局部变量都会导致编译报错。
  • lambda表达式之间不能相互赋值,即使看起来类型相同。

所以,在 1.1 中的例子可以使用 lambda表达式,代码如下:

int main()
{
	vector<Goods> v = { { "苹果", 2.1, 5 }, { "香蕉", 3, 4 }, { "橙子", 2.2, 3 }, { "菠萝", 1.5, 4 } };
	//价格升序
	sort(v.begin(), v.end(), [](const Goods& g1, const Goods& g2) {
		return g1._price < g2._price; });
	//价格降序
	sort(v.begin(), v.end(), [](const Goods& g1, const Goods& g2) {
		return g1._price > g2._price; });
	//评价升序
	sort(v.begin(), v.end(), [](const Goods& g1, const Goods& g2) {
		return g1._evaluate < g2._evaluate; });
	//评价降序
	sort(v.begin(), v.end(), [](const Goods& g1, const Goods& g2) {
		return g1._evaluate > g2._evaluate; });

	return 0;
}

1.3 函数对象与 lambda 表达式

函数对象,又称为仿函数,即可以像函数一样使用的对象,就是在类中重载了 operator() 运算符的类对象。

实际编译器在底层对于 lambda 表达式的处理方式,完全就是按照函数对象的方式处理的,即 lambda 表达式的底层就是仿函数。

测试代码:

编写了一个 Rate的类,该类对 ()运算符进行了重载,因此Rate类实例化出的 r1 对象就叫做函数对象,r1 可以像函数一样使用。然后编写一个 lambda 表达式,并借助 auto 将其赋值给 r2 对象,这时 r1 和 r2 都可以像普通函数一样使用,这个仿函数和 lamdba表达式的功能完全一致。

class Rate
{
public:
	Rate(double rate) 
		: _rate(rate)
	{}

	double operator()(double money, int year)
	{
		return money * _rate * year;
	}
private:
	double _rate;
};

int main()
{
	// 函数对象(仿函数)
	double rate = 0.49;
	Rate r1(rate);
	r1(10000, 2);

	// lambda
	auto r2 = [=](double monty, int year)->double {return monty * rate * year;};
	r2(10000, 2);

	return 0;
}

在调试模式下转到反汇编

r1 对象会先调用 Rate类的构造函数( Rate::Rate (0C513A7h)),然后 r1 才调用 Rate类的 ()运算符重载函数(Rate::operator() (0C511B8h)),汇编代码如下:

观察lambda表达式时,也能看到类似的汇编代码。

仿函数的汇编代码和 lambda表达式进行比较(图中圈起来的地方),比较发现,仿函数和lambda表达式的调用函数的汇编代码几乎一致,除了类名不相同。

从图中可以看出,lambda表达式的底层被转换成了仿函数,所以 lambda 表达式的本质上就是仿函数。

  • 实际上当我们定义一个lambda表达式后,编译器会自动生成一个类,在该类中对 ()运算符进行重载,实际 lambda函数体的实现就是这个仿函数的 operator()的实现。
  • 在调用 lambda表达式时,参数列表和捕获列表的参数,最终都传递给了仿函数的 operator()

该类的名字是编译器随机生成的,该类名只有编译器可以认识,这也是我们为什么要借助 auto 将其赋值给一个变量的原因。

解释上面 lambda表达式之间不能相互赋值的原因。

  • 因为lambda表达式底层的处理方式和仿函数是一样的,在VS下,lambda 表达式在底层会被处理为函数对象,该函数对象对应的类名叫做 <lambda_uuid>
  • 类名中的 uuid 叫做通用唯一识别码(Universally Unique Identifier),简单来说,uuid 就是通过算法生成一串字符串,保证在当前程序当中每次生成的 uuid 都不会重复。
  • lambda 表达式底层的类名包含 uuid,这样就能保证每个 lambda 表达式底层类名都是唯一的。

因此每个 lambda 表达式的类型都是不同的,这也就是 lambda 表达式之间不能相互赋值的原因,我们可以通过 typeid(变量名).name() 的方式来获取lambda表达式的类型。

int main()
{
	auto f1 = [] {cout << "hello world" << endl; };
	auto f2 = [] {cout << "hello world" << endl; };

	cout << typeid(f1).name() << endl; 
	cout << typeid(f2).name() << endl;

	return 0;
}

运行结果,可以看到,就算是两个一模一样的 lambda 表达式,它们的类型都是不同的。

--------------- END ---------------

「 作者 」 枫叶先生
「 更新 」 2023.4.19
「 声明 」 余之才疏学浅,故所撰文疏漏难免,
          或有谬误或不准确之处,敬请读者批评指正。