Jelajahi Sumber

更新文档:Rust入门教程(七)生命周期 (#11)

* 更新文档:Rust入门教程(七)生命周期
Cherry 1 tahun lalu
induk
melakukan
a7eccab394
2 mengubah file dengan 380 tambahan dan 0 penghapusan
  1. 378 0
      docs/Rust文档/Rust入门教程(七).md
  2. 2 0
      docs/guide/README.md

+ 378 - 0
docs/Rust文档/Rust入门教程(七).md

@@ -0,0 +1,378 @@
+# Rust入门教程(七):生命周期
+
+>Rust 生命周期机制是与所有权机制同等重要的资源管理机制。生命周期,简而言之就是引用的有效作用域,之所以引入这个概念主要是应对复杂类型系统中资源管理的问题。引用是对待复杂类型时必不可少的机制,毕竟复杂类型的数据不能被处理器轻易地复制和计算,但引用往往导致极其复杂的资源管理问题。
+
+## 生命周期
+
+- Rust 的每个引用都有自己的生命周期
+- 生命周期:引用保持有效的作用域
+- 大多数情况:生命周期是隐式的、可被推断的
+- 当引用的生命周期可能以不同的方式互相关联时:手动标注生命周期
+
+生命周期的主要目标:避免悬垂引用(dangling reference)
+
+```rust
+fn test01() {
+    {
+        let r;
+        {
+            let x = 3;
+            r = &x;
+        }
+        println!("{}", r);
+    }
+}
+```
+
+上面这段代码会在 `r = &x;` 处报错,因为当打印 `r` 的值的时候,`x` 已经离开了他的作用域,这时 `r` 指向的 `x` 的内存已经被释放,因此会报错。
+
+Rust 实际上是通过**借用检查器**来检查一些变量的生命周期。
+
+### 借用检查器
+
+Rust 编译器的借用检查器(borrow checker),用来比较作用域来判断所有的借用是否合法
+
+在上例中,借用检查器检测到 `r` 的生命周期大于 `x`,即被引用者的生命周期小于引用者的生命周期,因此编译会报错。
+
+### 函数中的泛型生命周期
+
+```rust
+fn test02() {
+    let string1 = String::from("Congratulations");
+    let string2 = "fantastic";
+    let result = longest(string1.as_str(), string2);
+    println!("The longest string is {}", result);
+}
+
+fn longest(x: &str, y: &str) -> &str {
+    if x.len() > y.len() {
+        x
+    } else {
+        y
+    }
+}
+```
+
+编译报错:
+
+```rust
+➜  ~/Code/rust/life_cycle git:(master) ✗ cargo run           
+   Compiling life_cycle v0.1.0 (/home/cherry/Code/rust/life_cycle)
+error[E0106]: missing lifetime specifier
+  --> src/main.rs:24:33
+   |
+24 | fn longest(x: &str, y: &str) -> &str {
+   |               ----     ----     ^ expected named lifetime parameter
+   |
+   = help: this function's return type contains a borrowed value, but the signature does not say whether it is borrowed from `x` or `y`
+help: consider introducing a named lifetime parameter
+   |
+24 | fn longest<'a>(x: &'a str, y: &'a str) -> &'a str {
+   |           ++++     ++          ++          ++
+
+For more information about this error, try `rustc --explain E0106`.
+```
+
+我们发现编译器会提示**缺少一个命名的生命周期参数**,这个函数返回一个借用的值,但是没有声明这个借用的值是来自 `x` 还是来自 `y`。值得说明的是,这个返回值的借用跟函数体的逻辑没有关系,要从函数签名就要看出返回值借用的值来自哪一个参数。
+
+根据编译器提示,我们声明一个泛型生命周期 `'a`,代码修改如下:
+
+```rust
+fn longest<'a> (x: &'a str, y: &'a str) -> &'a str {
+    if x.len() > y.len() {
+        x
+    } else {
+        y
+    }
+}
+```
+
+### 生命周期标注语法
+
+- 生命周期的标注不会改变引用的生命周期长度
+- 当指定了泛型生命周期参数,函数可以接收带有任何生命周期的引用
+- 生命周期的标注:描述了多个引用的生命周期间的关系,但不影响生命周期
+
+生命周期参数名语法如下:
+- 以 `'` 开头
+- 通常全小写且非常短
+- 习惯以 `'a` 表示
+
+生命周期标注的位置:
+
+- 在引用符号 `&` 后面标注
+- 使用空格将标注和引用类型区分开
+
+生命周期标注的例子:
+
+```rust
+&i32        // 一个引用
+&'a i32     // 带有显式生命周期的引用
+&'a mut i32 // 带有显式生命周期的可变引用
+```
+
+值得注意的是,单个生命周期标注本身没有意义,我们再看上面的 `longest` 函数:
+
+```rust
+fn longest<'a> (x: &'a str, y: &'a str) -> &'a str {
+    if x.len() > y.len() {
+        x
+    } else {
+        y
+    }
+}
+```
+
+泛型的生命周期参数声明在函数名和参数列表之间的 `<>` 中。
+
+我们仔细分析这个函数:
+
+`longest` 函数的两个参数都声明了生命周期,就要求这两个引用必须和泛型的生命周期存活相同的时间,而且函数所返回的字符串切片的存活时长也不能小于 `'a` 这个生命周期。为引用指明生命周期,是要确保当引用失去了所有权后而被移出内存。当在函数参数中指明生命周期时,我们并没有改变参数和返回值的生命周期,只是向调用检查器指出了一些可用于检查非法调用的约束。而 `longest` 函数本身并不需要知道参数 `x` 和 `y` 具体的存活时长,只需要某个可以代替 `'a` 的作用域,同时满足函数的签名约束。实际上,若函数引用其外部的代码或者被外部代码引用,只靠 rust 本身确定参数和返回值的生命周期时不可能的,这样的话,函数所使用的生命周期在每次调用中都会发生变化,正因为如此,我们才需要手动对生命周期进行标注。
+
+当我们将两个引用传入函数时,`x` 和 `y` 作用域重叠的部分将用来代替 `'a` 这个生命周期的作用域,换句话说,这个泛型生命周期得到的具体的生命周期就是 `x` 和 `y` 两者生命周期较短的那个,因为返回值也标注了相同的生命周期,因此返回值的引用在两者比较短的生命周期内都是有效的。
+
+那么生命周期标注是如何对 `longest` 函数进行限制的?我么修改一下代码:
+
+```rust
+fn test02() {
+    let string1 = String::from("Congratulations");
+    {
+        let string2 = "fantastic";
+        let result = longest(string1.as_str(), string2);
+        println!("The longest string is {}", result);
+    }
+}
+
+fn longest(x: &str, y: &str) -> &str {
+    if x.len() > y.len() {
+        x
+    } else {
+        y
+    }
+}
+```
+
+将 string1 下面三行代码放到一个单独的作用域里,string2 是一个字符串字面值(字符串切片),他的生命周期相当于是一个静态的生命周期,在整个程序运行期间都存活,而 result 引用也会在 Line 7 大括号结束之前保持有效,因此代码不会报错。
+
+【注】:`&str` 是直接在可执行文件中加载的,即这块内存直接放到可执行文件里面的,所以整个程序运行期间,这块内存比较特殊,不会由于所有权而消失,所以指这块内存的引用,一定会一直指向一个合法内存,所以其引用的生命周期是 `'static`,也就是全局静态,也不可能出现什么悬垂引用。
+
+再改一下代码,将 result 声明放到外面,然后将 print 也放到外面,将 string2 改成 String 类型:
+
+```rust
+fn test02() {
+    let string1 = String::from("Congratulations");
+    let result;
+    {
+        let string2 = String::from("fantastic");
+        result = longest(string1.as_str(), string2.as_str());
+    }
+    println!("The longest string is {}", result);
+}
+```
+
+我们发现 Line 6 报错了。string1 的生命周期为 Line 2~9,string2 的生命周期为 Line 5~7,所以 `'a` 所表示的生命周期为 Line 5~7,而 result 的生命周期为 Line 3~9,不在 `'a` 的范围内,因此编译报错,我们来看一下编译具体的错误:
+
+```rust
+➜  ~/Code/rust/life_cycle git:(master) ✗ cargo run
+   Compiling life_cycle v0.1.0 (/home/cherry/Code/rust/life_cycle)
+error[E0597]: `string2` does not live long enough
+  --> src/main.rs:30:44
+   |
+30 |         result = longest(string1.as_str(), string2.as_str());
+   |                                            ^^^^^^^^^^^^^^^^ borrowed value does not live long enough
+31 |     }
+   |     - `string2` dropped here while still borrowed
+32 |     println!("The longest string is {}", result);
+   |                                          ------ borrow later used here
+
+For more information about this error, try `rustc --explain E0597`.
+error: could not compile `life_cycle` due to previous error
+```
+
+这个报错的含义是,为了让 result 这个变量在打印时是有效的,那么 string2 必须在外部作用域结束之前一直保持有效,因为在函数声明中参数和返回值都使用了相同的生命周期。
+
+在上例中,尽管 string1 的长度大于 string2 的长度,函数返回的是 string1 的引用,但是编译器并不知道这一点,编译器只知道 `longest` 函数返回引用的生命周期是 `x` 和 `y` 生命周期比较短的那个。
+
+## 深入理解生命周期
+
+- 指定生命周期参数的方式依赖于函数所做的事情,在上面的例子中,若 `longest` 函数改为:
+
+```rust
+fn longest(x: &str, y: &str) -> &str {
+    x
+}
+```
+
+这个时候,函数只返回变量 `x`,而与 `y` 无关,因此无需为 `y` 指定生命周期。
+
+- 从函数返回引用时,返回类型的生命周期参数需要与其中一个参数的生命周期匹配
+- 如果返回的引用没有指向任何参数,那么他只能引用函数内创建的值
+  - 这就是**悬垂引用**,该值在函数结束时就走出了作用域,见下面的例子
+
+```rust
+fn test02() {
+    let string1 = String::from("Congratulations");
+    let string2 = "fantastic";
+    let result = longest(string1.as_str(), string2);
+    println!("The longest string is {}", result);
+}
+
+fn longest<'a> (x: &'a str, y: &'a str) -> &'a str {
+    let res = String::from("abc");
+    res.as_str()
+}
+```
+
+上面的代码中,`longest` 函数中返回了局部变量 `res`,当函数执行完毕时,局部变量 `res` 所指向的内存已经被释放掉,因此 `test02` 中的 `result` 变量指向的 `res` 内存已经被清理,这就造成了**悬垂引用**,非常类似于 `C/C++` 的野指针。
+
+那么我就是想返回函数中的局部变量,应该怎么办呢?解决办法也很简单,就是直接返回这个值而不是返回引用,这样就将变量的所有权移交出去了,如下所示:
+
+```rust
+fn longest<'a> (x: &'a str, y: &'a str) -> String {
+    let res = String::from("abc");
+    res
+}
+```
+
+**因此从根本上讲,生命周期这种语法规则,是用来关联函数的不同参数及返回值之间的生命周期,一旦他们取得了某种联系,rust 就会获得足够的信息来支持保证内存安全的操作,并且阻止那些可能会导致悬垂指针或者其他违反内存安全的行为。**
+
+## Struct 定义中的生命周期标注
+
+struct 里可以包括:
+- 自持有类型(类似于 i32 等)
+- 引用:需要在每个引用上添加生命周期标注
+
+```rust
+struct ImportantExcerpt<'a> {
+    part: &'a str,
+}
+
+fn test04() {
+    let novel = String::from("Today is Tuesday. And I will take part in a meeting.");
+
+    let first_sentence = novel.split(".").next().expect("Can't find a '.'");
+    let i = ImportantExcerpt {
+        part: first_sentence,
+    };
+}
+```
+
+## 生命周期的省略
+
+每个引用都有生命周期,需要为使用生命周期的函数或 struct 指定生命周期参数
+
+但是下面这个例子,没有任何生命周期的标注,仍然可以通过编译:
+
+```rust
+fn first_word(s: &str) -> &str {
+    let byte = s.as_bytes();
+    for (i, &item) in byte.iter().enumerate() {
+        if item == b' ' {
+            return &s[0..i];
+        }
+    }
+    &s[..]
+}
+```
+
+按照原来的 rust 规范,函数声明、参数和返回类型前都是要加上生命周期标注的,但是 rust 团队发现程序员总是一遍又一遍地标注同样的生命周期,而且这些场景是可以预测的,有着明确的模式,因此 rust 团队就将这些模式写入了编译器,使得借用检查器可以自动对这些模式进行推导而无需显式标注。
+
+**生命周期省略规则**
+
+- 在 Rust 引用分析中所编入的模式称为**生命周期省略规则**
+  - 这些规则无需开发者来遵守
+  - 它们是一些特殊情况,由编译器来考虑
+  - 如果你的代码符合这些情况,那么就无需显式标注生命周期
+- 生命周期省略规则不会提供完整的推断:
+  - 如果应用规则后,引用的生命周期仍然模糊不清→编译错误
+  - 解决办法:添加生命周期标注,表明引用间的相互关系
+
+
+### 输入、输出生命周期
+
+生命周期在:
+- 函数/方法的参数中,叫做输入生命周期
+- 函数/方法的返回值中,叫输出生命周期
+
+### 生命周期省略的三个规则
+
+编译器使用三个规则在没有显式标注生命周期的情况下,来确定引用的生命周期
+- 规则 1 应用于输入生命周期
+- 规则 2、3 应用于输出生命周期
+- 如果编译器应用完三个规则后,仍然无法确定有效的生命周期,则报错
+- 这些规则适用于 fn 和 impl 块
+
+**规则 1:** 每个引用类型都有自己的生命周期
+**规则 2:** 如果只有 1 个输入生命周期参数,那么该生命周期被赋给所有输出生命周期参数
+**规则 3:** 如果有多个输入生命周期参数,但其中一个是 `&self` 或 `&mut self`,那么 `self` 的生命周期会被赋给所有的输出生命周期参数
+
+**生命周期省略的三个规则-例子**
+
+假设我们是编译器:
+
+`fn first_word(s: &str) -> &str {}`
+`fn first_word<'a>(s: &'a str) -> &str {}`
+`fn first_word<'a>(s: &'a str) -> &'a str {}`
+
+`fn longest(x: &str, y: &str) -> &str {}`
+`fn longest<'a, 'b>(x: &'a str, y: &'b str) -> &str {}`
+
+### 方法定义中的生命周期标注
+
+- 在 struct 上使用生命周期实现方法,语法和泛型参数的语法一样
+- 在哪声明和使用生命周期参数,依赖于:
+  - 生命周期参数是否和字段、方法的参数或返回值有关
+- struct 字段的生命周期名:
+  - 在 impl 后声明
+  - 在 struct 名后使用
+  - 这些生命周期是 struct 类型的一部分
+- impl 块内的方法签名中
+  - 引用必须绑定于 struct 字段引用的生命周期,或者引用是独立的也可以
+  - 生命周期省略规则经常使得方法中的生命周期标注不是必须的
+
+```rust
+struct ImportantExcerpt<'a> {
+    part: &'a str,
+}
+
+impl<'a> ImportantExcerpt<'a> {
+    fn level(&self) -> u32 {
+        3
+    }
+
+    fn printSome(&self, words: &str) -> &str {
+        println!("There are some words: {}", self.part);
+        self.part
+    }
+}
+```
+
+## 静态生命周期
+
+- `'static` 是一个特殊的生命周期:整个程序的持续时间
+  - 例如:所有的字符串字面值都拥有 `'static` 生命周期
+    - `let s: &'static str = "I have a static lifetime.";`
+    - 字符串字面值是存在二进制程序中,总是可用
+- 为引用指定 `'static` 之前要三思
+  - 是否需要引用在整个生命周期内都存活
+
+### 一个泛型参数类型,Trait Bound 和生命周期的综合例子
+
+```rust
+use std::fmt::Display;
+
+fn longest_with_an announcement<'a,T>
+    (x: &'a str, y: &'a str, ann: T) -> 'a str
+where
+    T: Display,
+{
+    println! ("Announcement! {}", ann);
+    if x.len() > y.len() {
+        x
+    } else {
+        y
+    }
+}
+```
+
+**要注意的是,生命周期也是泛型的一种。**

+ 2 - 0
docs/guide/README.md

@@ -11,3 +11,5 @@
 #### [Rust学习文档(五)](/Rust文档/Rust入门教程(五)/)
 
 #### [Rust学习文档(六)](/Rust文档/Rust入门教程(六)/)
+
+#### [Rust学习文档(七)](/Rust文档/Rust入门教程(七)/)