”工欲善其事,必先利其器。“—孔子《论语.录灵公》
首页 > 编程 > C 中晦涩难懂的“restrict”关键字

C 中晦涩难懂的“restrict”关键字

发布于2024-11-04
浏览:552

The Obscure “restrict” Keyword in C

介绍

除此之外,C99 添加了 limit 关键字,作为程序员指定指针是 only 指向作用域中给定对象的指针的一种方式,从而给编译器一个“提示” ”,当通过该指针访问对象时,它可能会执行额外的优化。

问题

为了说明限制要解决的问题,请考虑如下函数:

void update_ptrs( int *p, int *q, int const *v ) {
  *p  = *v;
  *q  = *v;
}

编译器将生成 x86-64 代码,例如:

mov eax, [rdx]  ; tmp = *v   // 1
add [rdi], eax  ; *p  = tmp
mov eax, [rdx]  ; tmp = *v   // 3
add [rsi], eax  ; *q  = tmp

你可能想知道为什么它会生成第 3 行,因为它看起来与第 1 行是多余的。问题是编译器不知道你没有做这样的事情:

int x = 1, v = 2;
update_ptrs( &v, &x, &v );   // x = 5, v = 4

在update_ptrs()中,p和v将alias相同 int,因此编译器必须谨慎行事并假设*v的值可以在读取之间改变,因此需要额外的 mov 指令。

一般来说,C 中的指针会混淆优化,因为编译器无法知道两个指针是否彼此别名。 在性能关键的代码中,消除内存读取

可能是一个巨大的胜利如果编译器可以安全地做到这一点。

解决方案

为了解决上述问题,C 中添加了restrict,以允许指定给定指针是

only 指向该指针作用域中的对象的指针,即同一作用域别名中没有其他指针它。

要使用限制,请将其插入

声明中的*和指针名称之间。 重写为使用限制的 update_ptrs() 将是:

void update_ptrs_v2( int *限制 p, int *限制 q, int const *限制 v ) { *p = *v; *q = *v; }
void update_ptrs_v2( int *restrict p, int *restrict q,
                     int const *restrict v ) {
  *p  = *v;
  *q  = *v;
}
(从右到左读取,例如 v 是指向常量 int 的受限指针;或使用 cdecl。)

通过添加限制,编译器现在可以生成如下代码:


mov eax, [rdx] ; tmp = *v 添加[rdi],eax; *p = tmp 添加[rsi],eax; *q = tmp
void update_ptrs_v2( int *restrict p, int *restrict q,
                     int const *restrict v ) {
  *p  = *v;
  *q  = *v;
}
现在,编译器能够删除附加 mov 指令的前第 3 行。

也许使用restrict的最著名的例子是标准库函数memcpy()。 这是复制内存块的最快方法

如果源地址和目标地址重叠。当地址 do 重叠时,存在稍慢的 memmove() 函数。

陷阱

滥用限制会导致未定义的行为,例如,将

do 彼此别名的指针传递给 update_ptrs_v2() 或 memcpy()。 在某些情况下,编译器可以警告您,但并非在所有情况下,因此不要依赖编译器来捕获误用。

请注意,restrict 是针对给定范围的。 将一个受限指针分配给同一范围内的另一个

会导致未定义的行为:

void f( int *限制 d, int *限制 s ) { int *限制 p = s; // 未定义的行为
void update_ptrs_v2( int *restrict p, int *restrict q,
                     int const *restrict v ) {
  *p  = *v;
  *q  = *v;
}
但是,您可以将受限制的指针分配给不受限制的指针:


void f( int *限制 d, int *限制 s ) { int *p = s; // 好的
void update_ptrs_v2( int *restrict p, int *restrict q,
                     int const *restrict v ) {
  *p  = *v;
  *q  = *v;
}
即使 p 不受限制,编译器仍然可以执行相同的优化。

将内部作用域中的受限指针分配给外部作用域中的另一个受限指针也是可以的(但反之则不然):


void f( int *限制 d, int *限制 s ) { { // 内部作用域 int *限制 p = s; // 好的 // ... s = p; // 未定义的行为 } }
void update_ptrs_v2( int *restrict p, int *restrict q,
                     int const *restrict v ) {
  *p  = *v;
  *q  = *v;
}
何时(以及何时不)使用限制

首先,您绝对应该分析您的代码(甚至可能查看生成的汇编代码),看看使用限制是否确实会

显着性能改进,以证明冒潜在陷阱的风险是合理的。 诊断由于滥用限制而导致的错误非常很难做到。

其次,如果restrict的使用仅限于实现一个函数,其中通过受限指针访问的内存是由

you分配的,那么它会更安全。 例如,给定:

无效更安全(无符号n){ n = n % 2 != 0; // 通过向上舍入使偶数 int *const array = malloc( n * sizeof(unsigned) ); 无符号 *restrict half_1st = 数组; 无符号 *restrict half_2nd = 数组 n/2; // ... 自由(数组); }
void update_ptrs_v2( int *restrict p, int *restrict q,
                     int const *restrict v ) {
  *p  = *v;
  *q  = *v;
}
代码可以安全地对数组的前半部分和后半部分进行操作,因为它们不重叠(假设您从未访问 half_1st[n/2] 或更多)。

第三,如果在函数的参数中使用restrict,那么它可能

不太安全。 例如,将 Safer() 与 update_ptrs_v2() 进行对比,其中 调用者 控制指针。 知道,调用者得到了错误的并传递了别名的指针。

各种各样的

只有指向对象(或void)的指针可以用restrict:限定

限制 int x; // 错误:无法限制对象 int 限制 *p; // 错误:指向限制对象的指针 int (*限制 f)(); // 错误:函数指针
void update_ptrs_v2( int *restrict p, int *restrict q,
                     int const *restrict v ) {
  *p  = *v;
  *q  = *v;
}
可以对结构体成员使用restrict,例如:


结构节点{ void *限制数据; 结构节点*限制左; 结构节点*限制权限; };
void update_ptrs_v2( int *restrict p, int *restrict q,
                     int const *restrict v ) {
  *p  = *v;
  *q  = *v;
}
表示 data 将是指向该数据的唯一指针,并且 left 和 right 永远不会指向同一个节点。 然而,对结构成员使用限制是非常不常见的。

最后,C

没有有限制。 为什么不呢? 答案很长,但 TL;DR 版本是:

    它可能是 C 委员会不想从 C 导入的难以发现的错误的来源。
  • C 增加了对指针的使用,例如,这使得安全地使用限制变得更加困难。
然而,许多编译器都有 __restrict__ 作为扩展。

结论

在有限的情况下,使用限制可以提高性能,但也存在一些重大缺陷。 如果您正在考虑使用限制,请首先分析您的代码。

明智地使用。

版本声明 本文转载于:https://dev.to/pauljlucas/the-obscure-restrict-keyword-in-c-2541如有侵犯,请联系[email protected]删除
最新教程 更多>
  • 如何处理PHP文件系统功能中的UTF-8文件名?
    如何处理PHP文件系统功能中的UTF-8文件名?
    在PHP的Filesystem functions中处理UTF-8 FileNames 在使用PHP的MKDIR函数中含有UTF-8字符的文件很多flusf-8字符时,您可能会在Windows Explorer中遇到comploreer grounder grounder grounder gro...
    编程 发布于2025-06-10
  • 哪种方法更有效地用于点 - 填点检测:射线跟踪或matplotlib \的路径contains_points?
    哪种方法更有效地用于点 - 填点检测:射线跟踪或matplotlib \的路径contains_points?
    在Python Matplotlib's path.contains_points FunctionMatplotlib's path.contains_points function employs a path object to represent the polygon.它...
    编程 发布于2025-06-10
  • 您如何在Laravel Blade模板中定义变量?
    您如何在Laravel Blade模板中定义变量?
    在Laravel Blade模板中使用Elegance 在blade模板中如何分配变量对于存储以后使用的数据至关重要。在使用“ {{}}”分配变量的同时,它可能并不总是最优雅的解决方案。幸运的是,Blade通过@php Directive提供了更优雅的方法: $ old_section =“...
    编程 发布于2025-06-10
  • CSS可以根据任何属性值来定位HTML元素吗?
    CSS可以根据任何属性值来定位HTML元素吗?
    靶向html元素,在CSS 中使用任何属性值,在CSS中,可以基于特定属性(如下所示)基于特定属性的基于特定属性的emants目标元素: 字体家庭:康斯拉斯(Consolas); } 但是,出现一个常见的问题:元素可以根据任何属性值而定位吗?本文探讨了此主题。的目标元素有任何任何属性值,属...
    编程 发布于2025-06-10
  • PHP与C++函数重载处理的区别
    PHP与C++函数重载处理的区别
    作为经验丰富的C开发人员脱离谜题,您可能会遇到功能超载的概念。这个概念虽然在C中普遍,但在PHP中构成了独特的挑战。让我们深入研究PHP功能过载的复杂性,并探索其提供的可能性。在PHP中理解php的方法在PHP中,函数超载的概念(如C等语言)不存在。函数签名仅由其名称定义,而与他们的参数列表无关。...
    编程 发布于2025-06-10
  • 人脸检测失败原因及解决方案:Error -215
    人脸检测失败原因及解决方案:Error -215
    错误处理:解决“ error:( - 215)!empty()in Function openCv in Function MultSiscale中的“检测”中的错误:在功能检测中。”当Face Cascade分类器(即面部检测至关重要的组件)未正确加载时,通常会出现此错误。要解决此问题,必须...
    编程 发布于2025-06-10
  • 如何使用Java.net.urlConnection和Multipart/form-data编码使用其他参数上传文件?
    如何使用Java.net.urlConnection和Multipart/form-data编码使用其他参数上传文件?
    使用http request 上传文件上传到http server,同时也提交其他参数,java.net.net.urlconnection and Multipart/form-data Encoding是普遍的。 Here's a breakdown of the process:Mu...
    编程 发布于2025-06-10
  • Spark DataFrame添加常量列的妙招
    Spark DataFrame添加常量列的妙招
    在Spark Dataframe ,将常数列添加到Spark DataFrame,该列具有适用于所有行的任意值的Spark DataFrame,可以通过多种方式实现。使用文字值(SPARK 1.3)在尝试提供直接值时,用于此问题时,旨在为此目的的column方法可能会导致错误。 df.withCo...
    编程 发布于2025-06-10
  • 解决Spring Security 4.1及以上版本CORS问题指南
    解决Spring Security 4.1及以上版本CORS问题指南
    弹簧安全性cors filter:故障排除常见问题 在将Spring Security集成到现有项目中时,您可能会遇到与CORS相关的错误,如果像“访问Control-allo-allow-Origin”之类的标头,则无法设置在响应中。为了解决此问题,您可以实现自定义过滤器,例如代码段中的MyFi...
    编程 发布于2025-06-10
  • 在C#中如何高效重复字符串字符用于缩进?
    在C#中如何高效重复字符串字符用于缩进?
    在基于项目的深度下固定字符串时,重复一个字符串以进行凹痕,很方便有效地有一种有效的方法来返回字符串重复指定的次数的字符串。使用指定的次数。 constructor 这将返回字符串“ -----”。 字符串凹痕= new String(' - ',depth); console.Wr...
    编程 发布于2025-06-10
  • Java为何无法创建泛型数组?
    Java为何无法创建泛型数组?
    通用阵列创建错误 arrayList [2]; JAVA报告了“通用数组创建”错误。为什么不允许这样做?答案:Create an Auxiliary Class:public static ArrayList<myObject>[] a = new ArrayList<myO...
    编程 发布于2025-06-10
  • Go语言如何动态发现导出包类型?
    Go语言如何动态发现导出包类型?
    与反射软件包中的有限类型的发现能力相反,本文探索了替代方法,探索了在Runruntime。go import( “ FMT” “去/进口商” ) func main(){ pkg,err:= incorter.default()。导入(“ time”) 如果err...
    编程 发布于2025-06-10
  • 在JavaScript中如何并发运行异步操作并正确处理错误?
    在JavaScript中如何并发运行异步操作并正确处理错误?
    同意操作execution 在执行asynchronous操作时,相关的代码段落会遇到一个问题,当执行asynchronous操作:此实现在启动下一个操作之前依次等待每个操作的完成。要启用并发执行,需要进行修改的方法。 第一个解决方案试图通过获得每个操作的承诺来解决此问题,然后单独等待它们: co...
    编程 发布于2025-06-10
  • 编译器报错“usr/bin/ld: cannot find -l”解决方法
    编译器报错“usr/bin/ld: cannot find -l”解决方法
    错误:“ usr/bin/ld:找不到-l “ 此错误表明链接器在链接您的可执行文件时无法找到指定的库。为了解决此问题,我们将深入研究如何指定库路径并将链接引导到正确位置的详细信息。添加库搜索路径的一个可能的原因是,此错误是您的makefile中缺少库搜索路径。要解决它,您可以在链接器命令中添加...
    编程 发布于2025-06-10
  • 在细胞编辑后,如何维护自定义的JTable细胞渲染?
    在细胞编辑后,如何维护自定义的JTable细胞渲染?
    在JTable中维护jtable单元格渲染后,在JTable中,在JTable中实现自定义单元格渲染和编辑功能可以增强用户体验。但是,至关重要的是要确保即使在编辑操作后也保留所需的格式。在设置用于格式化“价格”列的“价格”列,用户遇到的数字格式丢失的“价格”列的“价格”之后,问题在设置自定义单元格...
    编程 发布于2025-06-10

免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。

Copyright© 2022 湘ICP备2022001581号-3