前言

ReactiveX 它是一个与语言无关的编程思想。作为成员框架之一 RxSwift 落地了大部分 ReactiveX 中关于流的操作。官方描述:

An API for asynchronous programming with observable streams

ReactiveX is a combination of the best ideas from the Observer pattern, the Iterator pattern, and functional programming

本篇主要介绍 RxSwift 的内部流是如何产生和订阅,这里默认大家是有 RxSwift 使用经验的。关于响应式编程在移动端已经是一个相对成熟的概念了,有很多好文章,比如 FRP 系列。如果你在项目中犹豫使用哪个框架可以看看这两篇文章的分析:

Observable

Rx 中的 Observable Stream(观察流),为了方便这里简称为 。流中的元数据可以有多个或者单个,这里统称为节点。既然一切皆流,那就从流的创建讲起,上代码:

1Observable.of(1, 2, 3)
2    .subscribe( { print($0) })

我们看第一行,它把 Swift.Sequence<Int> 序列 [1, 2, 3] 转换为流,of(_:) 方法的声明如下:

1extension ObservableType {
2   
3    public static func of(_ elements: Element ..., scheduler: ImmediateSchedulerType = CurrentThreadScheduler.instance) -> Observable<Element> {
4        return ObservableSequence(elements: elements, scheduler: scheduler)
5    }
6}

利用 Swift 的 Protcol Extesion 来为 ObservableType 添加默认了实现,它把 Sequence<Int> 存入了 ObservableSequence 中并返回。

大概了解一下 ObservableSequence 的类关系:

1| --- ObservableSequence
2    | --- Producer 
3        | --- Observable (class)
4            | --- ObservableType (Protocol)
5                | --- ObservableConvertibleType (Protocol)

根协议 ObservableConvertibleType 利用关联类型声明了返回值为关联类型的泛型方法 asObservable:

1public protocol ObservableConvertibleType {
2    /// Type of elements in sequence.
3    associatedtype Element
4    func asObservable() -> Observable<Element>
5}

协议 ObservableType 则声明了 subscribe(_:) 方法:

 1public protocol ObservableType: ObservableConvertibleType {
 2   
 3    func subscribe<Observer: ObserverType>(_ observer: Observer) -> Disposable where Observer.Element == Element
 4}
 5
 6extension ObservableType {
 7    /// Default implementation of converting `ObservableType` to `Observable`.
 8    public func asObservable() -> Observable<Element> {
 9        // temporary workaround
10        //return Observable.create(subscribe: self.subscribe)
11        return Observable.create { o in
12            return self.subscribe(o)
13        }
14    }
15}

并利用 subscribe(_:) 方法完成了对 asObservable() 默认实现的扩展。

关于注释 temporary workaround,翻了一下 git history 在 Swift 3.0 添加的。这种写法在 Swift 5.0 上是可以 work 的,不知为何注释了。那为什么可以这么写呢 ?稍微扯一下,可以看 creat(_:) 的声明:

1extension ObservableType {
2   
3    public static func create(_ subscribe: @escaping (AnyObserver<Element>) -> Disposable) -> Observable<Element> {
4        return AnonymousObservable(subscribe)
5    }
6}

其参数 subscribe 是一个 closure,而 closure 本质就是匿名函数。在 Swift 中函数作为一等公民,是可以直接作为参数传递的。因此,上面可以省略 closure 直接写成:

1Observable.create(self.subscribe)

再来 Observable :

 1public class Observable<Element> : ObservableType {
 2    
 3    public func subscribe<Observer: ObserverType>(_ observer: Observer) -> Disposable where Observer.Element == Element {
 4        rxAbstractMethod()
 5    }
 6    
 7    public func asObservable() -> Observable<Element> {
 8        return self
 9    }
10}

它仅做了两件事:

  1. subscribe(_:) 方法标记为抽象方法,并通过 fatalError 来强制要求子类去实现;
  2. asObservable() 中将 self 直接 return。

上面代码中没有列出 init()deinit() 的实现,RxSwift 在这两方法中引入了内部的资源统计,用于 debug,实现如下,感兴趣的可以深究:

 1init() {
 2    #if TRACE_RESOURCES
 3        _ = Resources.incrementTotal()
 4    #endif
 5}
 6deinit {
 7    #if TRACE_RESOURCES
 8        _ = Resources.decrementTotal()
 9    #endif
10}

序列存储已经结束,流的创建才刚刚开始。先贴一张脑图补一补,其实每个流的变换操作背后都对应一个 ObservableType 的扩展。

rxswift

Producer

再来看本文的重点之一 Producer:

 1class Producer<Element> : Observable<Element> {
 2    override func subscribe<Observer: ObserverType>(_ observer: Observer) -> Disposable where Observer.Element == Element {
 3        /// Scheduler {
 4        let disposer = SinkDisposer()
 5        let sinkAndSubscription = self.run(observer, cancel: disposer)
 6        disposer.setSinkAndSubscription(sink: sinkAndSubscription.sink, subscription: sinkAndSubscription.subscription)
 7        /// }
 8    }
 9
10    func run<Observer: ObserverType>(_ observer: Observer, cancel: Cancelable) -> (sink: Disposable, subscription: Disposable) where Observer.Element == Element {
11        rxAbstractMethod()
12    }
13}

注释的 Scheduler 是 RxSwift 中相关的线程调度,它会根据标识选择相应线程去处理任务,我们先忽略。

看字面意思也能猜出它的作用吧。同样为抽象类,它的角色更像是一个管理者。它管理着 Observable 的创建、订阅、回收。每个 Producer 实例则对应一条流水线,而 RxSwift 则可以看作大型工厂,通过 Producer 持续的生产和消费 Observable。

###run(_:cancel:)

它对应流的创建,也包括对每个节点发送 Event 事件。作为抽象方法,子类通过重载来提供流的多元化创建。同时 run 方法所返回的 sink 则保存了各个节点的元数据,subscription 则保存了流的订阅操作。详细会在 Sink 类作展开。

###subscribe(_:)

它通过 sinkDisposer 来统一回收流所引用的元数据以及订阅相关的资源。

  1. 判断是否需要用 scheduler 切换到指定的线程,来进行订阅逻辑的处理;
  2. 创建 sinkDisposer,同 obserer 一起作为 run(_:cancel:) 的入参;
  3. 将执行 run(_:cancel:) 方法后的结果保存到 sinkDisposer 中,为之后的资源销毁做准备;
  4. 最后返回 sinkDisposer;

那就先就近先看 SinkDisposer 类。

SinkDisposer

The returned disposable needs to release all references once it was disposed.

SinkDisposer 用于保证所有引用资源的最终释放。其声明如下:

 1private final class SinkDisposer: Cancelable {
 2    private enum DisposeState: Int32 {
 3        case disposed = 1
 4        case sinkAndSubscriptionSet = 2
 5    }
 6
 7    private let _state = AtomicInt(0)
 8    private var _sink: Disposable?
 9    private var _subscription: Disposable?
10
11    var isDisposed: Bool {
12        return isFlagSet(self._state, DisposeState.disposed.rawValue)
13    }
14
15    func setSinkAndSubscription(sink: Disposable, subscription: Disposable) { ... }
16
17    func dispose() { ... }
18}

先分析它的继承关系:

1| --- SinkDisposer
2    | --- Cancelable
3        | --- Disposable

Disposable 则是用于释放资源:

1public protocol Disposable {
2    /// Dispose resource.
3    func dispose()
4}

Cancelable,用于标识资源是否被释放:

1public protocol Cancelable : Disposable {
2    /// Was resource disposed.
3    var isDisposed: Bool { get }
4}

那 sinkDisposer 对保存结果做了什么处理,又是如何来释放资源的呢?主要靠下面这个方法。

####setSinkAndSubscription

实现如下:

 1self._sink = sink
 2self._subscription = subscription
 3
 4let previousState = fetchOr(self._state, DisposeState.sinkAndSubscriptionSet.rawValue)
 5if (previousState & DisposeState.sinkAndSubscriptionSet.rawValue) != 0 {
 6    rxFatalError("Sink and subscription were already set")
 7}
 8
 9if (previousState & DisposeState.disposed.rawValue) != 0 {
10    sink.dispose()
11    subscription.dispose()
12    self._sink = nil
13    self._subscription = nil
14}
  1. 保存 sink 和 subscription (均为 Disposable)
  2. 获取 previousState (当前资源的状态是否被标示为已清理或已设置) ;
  3. 如果 previousState 为 .sinkAndSubscriptionSet,则已设置过资源,直接抛错来防止重复调用;
  4. 如果 previousState 为 .disposed,则资源已不可用,会对 sink 和 subscription 执行 dispose() 以释放资源,同时将它们置 nil。

这里,可能有小伙伴有疑问,一个 state 如何保存两个状态?来瞅一眼 AtomicInt 简化后的部分实现:

 1final class AtomicInt: NSLock {
 2    fileprivate var value: Int32
 3    public init(_ value: Int32 = 0) {
 4        self.value = value
 5    }
 6}
 7
 8func fetchOr(_ this: AtomicInt, _ mask: Int32) -> Int32 {
 9    this.lock()
10    let oldValue = this.value
11    this.value |= mask
12    this.unlock()
13    return oldValue
14}
15
16func increment(_ this: AtomicInt) -> Int32 {
17    return add(this, 1)
18}
19
20func decrement(_ this: AtomicInt) -> Int32 {
21    return sub(this, 1)
22}
23
24...

说明:Atomic 中有返回值都的方法都有 @discardableResult 标记,只是这边简化了,同时所有方法都是 @inline(__always) 标记的。

之前版本的 AtomicInt 是用 OSAtomic.h 的 API 来实现的,现在改成用 NSLock 了。

这里看到 位运算符 大家应该知道它是怎么实现了吧。它通过每个 bit 来保存一个 flag 从而提高了访问效率。

接着我们看 fetchOr(_:_:) 它其实做了两件事情。

  1. 先取出当前 value 做为返回值;
  2. 将 mask 值保存到 value 中;

by the way,前面提到过 RxSwift 内部的资源统计方法 Resources.incrementTotal() 就是用 increment(_:) 实现的。 Resources.decrementTotal() 同理。

dispose

理解了 setSinkAndSubscription 后 dispose 就不难了,实现如下:

 1let previousState = fetchOr(self._state, DisposeState.disposed.rawValue)
 2
 3if (previousState & DisposeState.disposed.rawValue) != 0 {
 4    return
 5}
 6
 7if (previousState & DisposeState.sinkAndSubscriptionSet.rawValue) != 0 {
 8    guard let sink = self._sink else {
 9        rxFatalError("Sink not set")
10    }
11    guard let subscription = self._subscription else {
12        rxFatalError("Subscription not set")
13    }
14
15    sink.dispose()
16    subscription.dispose()
17
18    self._sink = nil
19    self._subscription = nil
20}
  1. 先取出 previousState 并将 .disposed 值写入 _state;
  2. 判断 previousState 为 disposed:
    1. 如果是则表明已经清理过,直接 return;
    2. 否则对 sink 和 subscription 执行 dispose() 以释放资源,同时将它们置 nil。

RxSwift 通过 AutomicInt 的位运算,巧妙的用一个变量高效完成了多个状态的存储,最重要的是它保证了只有一次有效的 dispose 操作。还有很重要的一点,在释放资源后,sinkDisposer 都会主动将 sink 和 subscription 置 nil,这是为了解决循环引用。因为在 Sink 内部其实也引用了 sinkDisposer。

Sink

项目中的 issue 有一个简单描述 What is a Sink ?

It’s an internal class used to implement the operators, that receives events and processes them.

Sink,接受 Event 事件并进行相应处理或者将其转发,是实现各种运算符的内部类,比如 Map、Reduce、Filter 运算符等。作为 Producer 背后的苦力一直默默付出。

Sink 从哪里来的呢?继续以开头的 Observable.of(1, 2, 3) 为例,看 ObservableSequence 的 run 方法实现:

1final private class ObservableSequence<Sequence: Swift.Sequence>: Producer<Sequence.Element> {
2    /// init ...
3   
4    override func run<Observer: ObserverType>(_ observer: Observer, cancel: Cancelable) -> (sink: Disposable, subscription: Disposable) where Observer.Element == Element {
5        let sink = ObservableSequenceSink(parent: self, observer: observer, cancel: cancel)
6        let subscription = sink.run()
7        return (sink: sink, subscription: subscription)
8    }
9}

在其初始化时将关键数据都保存起来:

  • self 为 Swift.Sequence<Int>
  • observer
  • cancel 为 SinkDisposer

Sink 创建完后会将执行 run() 的结果作为 subscription,同 sink 一起返回后存入 sinkDisposer 中。这也是前面提到的有循环引用的情况,不过在 sinkDispoer 的 dispose 过程中做了 break。

Sink 声明如下:

 1class Sink<Observer: ObserverType> : Disposable {
 2    fileprivate let _observer: Observer
 3    fileprivate let _cancel: Cancelable // sinkDisposer
 4    private let _disposed = AtomicInt(0)
 5
 6    final func forwardOn(_ event: Event<Observer.Element>) {
 7        if isFlagSet(self._disposed, 1) {
 8            return
 9        }
10        self._observer.on(event)
11    }
12
13    final func forwarder() -> SinkForward<Observer> {
14        return SinkForward(forward: self)
15    }
16
17    final var disposed: Bool {
18        return isFlagSet(self._disposed, 1)
19    }
20
21    func dispose() {
22        fetchOr(self._disposed, 1)
23        self._cancel.dispose()
24    }
25}

又见到 AtomicInt,这次是修饰 _disposed 属性,各位自行理解。我们看核心方法:

  1. forwardOn(_:) 用于转发,将 event 事件传递到 Observer.on(_:)
  2. dispose() 直接调用 sinkDisposer -> dispose();

forwarder() 返回的 SinkForward 是 Observer 对象,它将 sink 的 observer 做了包装,该方法主要用于 timeout() 方法。转发逻辑如下:

 1final class SinkForward<Observer: ObserverType>: ObserverType {
 2
 3    final func on(_ event: Event<Element>) {
 4        switch event {
 5        case .next:
 6            self._forward._observer.on(event)
 7        case .error, .completed:
 8            self._forward._observer.on(event)
 9            self._forward._cancel.dispose()
10        }
11    }
12}

它不仅收集资源同时还加工以及转发事件。最后回到 ObservableSequenceSink 来看 run() 方法:

 1final private class ObservableSequenceSink<Sequence: Swift.Sequence, Observer: ObserverType>: Sink<Observer> where Sequence.Element == Observer.Element {
 2    typealias Parent = ObservableSequence<Sequence>
 3
 4    private let _parent: Parent
 5
 6    func run() -> Disposable {
 7        return self._parent._scheduler.scheduleRecursive(self._parent._elements.makeIterator()) { iterator, recurse in
 8            var mutableIterator = iterator
 9            if let next = mutableIterator.next() {
10                self.forwardOn(.next(next))
11                recurse(mutableIterator)
12            }
13            else {
14                self.forwardOn(.completed)
15                self.dispose()
16            }
17        }
18    }
19}

_scheduler.scheduleRecursive 背后是 RxSwift 对于容器对象的线程调度,也不展开。这里的 run()方法 做了几个事情:

  1. Scheduler 会在指定线程中调用 Swift.Sequence 的迭代器,以遍历每个元素。
  2. 获取到元素后,将 next 事件不断转发给 Observer;
  3. 迭代结束后,发送 completed 事件至 Observer 并调用 dispose 出发 sinkDisposer 的资源清理操作;

关于 Sink 再说明一下,本篇是以 Sequence 作为切入点,不同 Operator 背后的 Producer 所产生的 Sink 实现是有不少区别的,比如 Just 流只产生单个节点,则直接在重载的 subscribe 方法里发送 Event 然后就调用 dispose 结束了。因此,每个 operator 的实现会有比较大的出路,但是整体流程是由这些内部类来限制和保证的。

Subscription

我们回到文章开头接着聊一聊订阅:

1.subscribe( { print($0) })

of(_:) 一样,订阅也是对 ObservableType 扩展来实现的。简化后如下:

 1extension ObservableType {
 2
 3    public func subscribe(_ on: @escaping (Event<Element>) -> Void)
 4        -> Disposable {
 5            let observer = AnonymousObserver { e in
 6                on(e)
 7            }
 8            return self.asObservable().subscribe(observer)
 9    }
10
11    public func subscribe(onNext: ((Element) -> Void)? = nil, onError: ((Swift.Error) -> Void)? = nil, onCompleted: (() -> Void)? = nil, onDisposed: (() -> Void)? = nil)
12        -> Disposable {
13        ...
14    }
15}

两个 subscribe 方法都是将订阅的操作存入 AnonymousObserver 中,然后通过 asObservable() 获取 producer 并最终其 subscribe(_:) 以完成订阅。

我们看看 AnonymousObserver 是什么来头:

 1final class AnonymousObserver<Element>: ObserverBase<Element> {
 2    typealias EventHandler = (Event<Element>) -> Void
 3    
 4    private let _eventHandler : EventHandler
 5    /// 这里同样忽略了 `init()` 与 `deinit()` 的资源统计逻辑
 6    init(_ eventHandler: @escaping EventHandler) {
 7        /// 资源统计
 8        self._eventHandler = eventHandler
 9    }
10
11    override func onCore(_ event: Event<Element>) {
12        return self._eventHandler(event)
13    }
14}

很简单,仅有一个 _eventHandler 属性保存订阅操作,然后在 onCore(_:) 中调用它。在翻它父类之前,看一眼它的继承关系:

1| --- AnonymousObserver
2    | --- ObserverBase
3        | --- Disposable、ObserverType

Disposable 我们已经知道了,看 ObserverType:

 1public protocol ObserverType {
 2    associatedtype Element
 3
 4    func on(_ event: Event<Element>)
 5}
 6
 7/// Convenience API extensions to provide alternate next, error, completed events
 8extension ObserverType {
 9
10    public func onNext(_ element: Element) {
11        self.on(.next(element))
12    }
13
14    public func onCompleted() {
15        self.on(.completed)
16    }
17    
18    public func onError(_ error: Swift.Error) {
19        self.on(.error(error))
20    }
21}

声明了 on(_:) 方法,同时针对 Event 的类型提供了三个便利方法。Event 则是一个嵌套枚举类型:

 1public enum Event<Element> {
 2    /// Next element is produced.
 3    case next(Element)
 4
 5    /// Sequence terminated with an error.
 6    case error(Swift.Error)
 7
 8    /// Sequence completed successfully.
 9    case completed
10}

ObserverBase

我们来看 ObserverBase

 1class ObserverBase<Element> : Disposable, ObserverType {
 2    private let _isStopped = AtomicInt(0)
 3
 4    func on(_ event: Event<Element>) {
 5        switch event {
 6        case .next:
 7            if load(self._isStopped) == 0 {
 8                self.onCore(event)
 9            }
10        case .error, .completed:
11            if fetchOr(self._isStopped, 1) == 0 {
12                self.onCore(event)
13            }
14        }
15    }
16
17    func onCore(_ event: Event<Element>) {
18        rxAbstractMethod()
19    }
20
21    func dispose() {
22        fetchOr(self._isStopped, 1)
23    }
24}

ObserverBase 利用 Atomic 声明的 _isStopped 属性作为哨兵,以保证资源被标记 _isStopped 后不会产生重复调用的。那么,如何做到的呢?

通过判断 _isStopped 是否为 0 来表示资源是否可用。一旦调用 dispose() 会将其值置为 1,则资源不可用。

另一种情况则在 on 方法内,实现逻辑如下:

  1. event 为 .next 事件:通过 load(_:) 取出 _isStopped 值并判断值是否为 0,是则执行 onCore(event)
  2. event 为 .error、.completed 事件:
    1. 通过 fetchOr(_:) 取出 _isStopped 当前值后并将其置为 1,以保证不再重入;
    2. 判断 _isStopped 当前值是否为 0,是则执行 onCore(event)

因此 ObserverBase 核心功作用是保证暴露给子类的 onCore(_:) 在观察结束后不会被重复执行。也就是保证 AnonymousObserver 的 eventHandler 被正确执行。

最后,回顾一下订阅相关流程:

rxswift-subscription

总结

RxSwift 所展示的订阅流的处理,不仅充分利用了 Swift 语言本身的特性,如为协议添加默认实现、采用泛型来约束类的行为、天然支持链式调用等。通过经典的设计模式 Producer–consumer,以多元化的 Producer 来轻松支持各种 operator 的实现。还有就是巧妙的运用了位运算来简化逻辑。

由于篇幅有限,Schedule 的调度逻辑并未展开,还有就是 DisposeBag 通篇未提及,就当是思考作业啦。