用户工具

站点工具


os:dragonflybsd

DragonFlyBSD

www.dragonflybsd.org

DragonFly 是一个以与 FreeBSD 采用的实现方式不同的方式来实现并发、SMP、集群以及其他操作系统特性的 BSD 分支。

DragonFly 项目的创始人和目前的 leader,Matthew Dillon 曾经是 FreeBSD SMPng 项目的重要开发人员,在 FreeBSD 3.x 时代开始,他对 FreeBSD 虚拟内存子系统、VFS子系统等多个重要部分进行了重写和增强,这些工作给 FreeBSD 4.x 系列的可靠性和性能打下了坚实的基础。FreeBSD 项目于 2000 年 6 月在 Sunnyvale 的 Yahoo 公司总部举行了 SMP 峰会,并正式启动了 SMPng 计划,即利用 BSDi 捐赠的 BSD/OS 源代码和相关的设计思想来改善 FreeBSD 的 SMP 能力。

Matthew Dillon 对 BSD/OS 中的许多实现并不满意,并在 SMPng 开发过程中展现了卓越的天赋和才华。由于 BSD/OS 与 FreeBSD 之间的巨大差异和时间限制,Matthew Dillon在开始移植细锁之后不久即决定重新实现上锁原语,而完成这些工作距离 SMPng 峰会结束仅经过几天时间。尽管如此,在随后的开发活动中,与其他开发人员不断爆发的冲突,导致他被多次停权警告,并最终撤销了commit权限。

2003年7月,Matt宣布在 FreeBSD 4.8-STABLE 的基础上的fork,并正式定名为 DragonFlyBSD (最初名字是TortoiseBSD,现在多称为 DragonFly)。与 FreeBSD 5.x 系列采用的细锁模型不同, DragonFly 采用消息模型作为内核的主要同步机制,并希望由此获得更好的可伸缩性。

DragonFly 同时采用了许多其他兄弟 BSD 系统的代码,其 malloc()函数的安全特性来自于OpenBSD,WiFi框架来自于FreeBSD 6,USB实现来源于NetBSD。许多 DragonFly 的特性也被移植到 FreeBSD 中。

目前 DragonFly 最值得关注的是 Matthew Dillon 新设计的 HAMMERFS 文件系统。

目标和开发计划

DFBSD的最终目标是在内核中提供对通用集群系统原生的支持,为了达到此目标,DFBSD项目将开发分解为两个阶段。

第一个阶段从2003年至2007年初,主要关注对主要内核子系统的重写。这几乎涉及到所有的子系统,尤其是内核核心和文件系统的API。这也是第二阶段的准备工作。

第二个阶段主要是为文件系统命名空间、文件空间和VM空间创建一个精巧的cache管理框架,这将为横跨多台机器运行的重负荷交互性程序从各个方面完全保证cache的一致性,同时也解决了对资源的细分问题(包括通过可控的VM上下文来细分cpu资源),这样可为分布在internet的不安全的第三方集群实现安全的分配方式(即使这些集群自身都不清楚自己的安全性,对那些愿意捐赠系统(计算)资源的人来说最基本和最重要的事情是不要因为捐赠资源而遭到攻击)。

技术特色

(本节内容来自于wikipedia)

Kernel design

同大多数现代内核一样,DragonFly的内核是混合型的,包含了微内核与统一内核的特色,并试图集成两种技术的优势。例如微内核的消息传递机制可以使OS能从被保护内存中节余更多空间;而统一内核在处理某些关键任务的速度方面更具优势。(DFBSD的)消息子系统看起来相似于某些微内核系统,例如Mach,虽然Mach设计的更加简单。DFBSD的消息子系统可以工作在同步或异步模式,并试图在给定条件下达到系统的最佳性能。

为达到项目的剩余目标,同时提供设备I/O和VFS的消息机制。新架构将允许内核的许多部分可以被转移到用户空间,其优点在于以更小的独立的程序取代了混杂在一起的大量代码,这使内核更小更容易调试;而那部分被允许在用户空间执行的内核代码带来的额外的好处是系统将更加稳定,即使用户空间的驱动崩溃了,内核也不会崩溃。

虽然同样被封装成消息,但实际上系统调用被分为用户空间版本和内核版本。把多种标准调用从内核转移到用户空间的兼容层有助于降低内核的的大小和复杂度,这就有助于维护DFBSD版本前向后向的兼容性。Linux和其他类UNIX系统的兼容性代码被转移出来就与此类似。DFBSD可在jails中创建原生用户空间兼容层的多个实例与UML(用户模式linux)就很相似。不同于UML(本质上宿主内核相当于一个不同的硬件平台,而UML是对其的一个linux移植)的是DFBSD的虚拟化对计算机的真实硬件不需要特殊驱动就可以直接通讯。

CPU localization

DFBSD中线程被设计成被CPU锁定,并且每个处理器有着自己的LWKT调度器。线程只能通过在cpu之间传递一个IPI(Interprocessor Interrupt)消息来转移,而不能依据优先级从一个处理器切换到另一个处理器。进程间的线程调度也是通过发送异步IPI消息来完成。(这样实现的)一个优点是通过线程子系统的明确的隔离使得SMP系统的处理器的板载cache不会包含重复数据,并通过给予系统里的每个处理器使用自己的cache来缓存不同的事物以达到更高的性能。

在多个内核线程间分割工作给各个LWKT子系统(举个网络代码的例子;每个处理器每个协议一个线程),通过在移除在多个内核任务中共享某些资源的需求来减轻冲突。但是这个DFBSD设计的与众不同的关键特性“CPU局部化算法的线程分割实现”是有争议的。

Protecting shared resources

为了能在多处理器的机器上安全的运行,对共享资源(文件、数据结构等)必须串行化,这样线程或者进程就不会在同一时刻修改同一资源。原子化操作、自旋锁、关键代码段(Critical sections 是一小块用来处理一份被共享资源的代码,该段代码必须独占的对某些共享资源的访问权。这可以让多行代码以原子方式执行。如果一个线程进入了critical section,另外一个线程绝对不能进入该critical section)、互斥标记,串行令牌和消息队列与所有可能的方式都可被用来防止访问冲突。linux和FreeBSD 5采用细化锁互斥模型来实现多处理器系统的高性能,然而DFBSD却不是这样,为了防止多个线程同时访问或者修改共享资源,DFBSD使用了关键代码段和串行令牌技术。虽然直到最近,DFBSD仍在使用SPLs,但是将被关键代码段取代。

很多系统核心包含LWKT子系统,其他事物中的IPI消息子系统和新的核心内存分配器是没有加锁的,也就是说他们工作时没有使用互斥标记,并且在单CPU上运行。关键代码段用于保护本地中断,也在单CPU上运行,保证了一个当前运行的线程不会被先占有。

串行令牌被用来阻止对其他CPU的同时访问并控制多个线程的同时并发,确保在一个给定时间只有一个线程运行。不同于互斥方式,处于阻塞或者休眠状态的线程并不能防止别的线程对共享资源的访问。使用串行令牌可以阻止使用互斥方式时导致的很多死锁和优先级倒置的问题,这样极大的简化了一个需要在多个线程共享一个资源的多步程序的设计和实现。串行令牌的代码看起来于linux现在使用的“Read-copy-update”很相似,但不同于linux当前RCU的实现,DFBSD实现了竞争只影响到与同一个令牌相关的处理器,而不是计算机里所有的处理器。

Additional features

在开发初期,DFBSD就开发了一个slab分配器取代了FreeBSD 4的内核内存分配器。新的分配器不像它取代的那些代码,在内存分配时既不需要互斥,也不需要时阻塞操作。而且它是mpsafe的。

DFBSD使用SFBUF(Super-Fast Buffers)和MSFUBF(Multi-SFBUFs)。SFBUF是用来管理快速单页内存映射并在适当的时候对页面缓存。它们被用来回收一个单VM页相对数据的引用。(这个设计)简单而又强大,在此之上可以发展很多功能,比如说在sendfile系统调用里实现“zero-copy”。

内核里很多地方使用了SFBUF,比如在Vnode Object Pager和PIPE子系统(间接的如XIO)里用来支持高带宽传输。一个SFBUF只能对应一个单VM页;而MSFBUFs被用来管理多页的快速内存映射。

SFBUF这个概念最初是FreeBSD项目中的David Greenman在实现sendfile系统调用时设计的,后来的完善依赖于Dr. Alan L. Cox和Matthew Dillon。MSFBUFs则是由Hiten Pandya和Matthew Dillon设计的。

版本发布情况

第三方软件管理

原创内容

(本节内容来源于wiki.dragonflybsd.org)

acxcontrol - Texas Instruments ACX100/TNETW1130(ACX111) 网卡工具

battd - 电池状态监控守护进程

checkpt - 对进程还原点的恢复支持 (在一个兼容系统里串行进程状态可以被恢复)

dntpd - NTP客户端守护进程

ECC detection - 在ECC系统里检测内存错误

jscan - 扫描日志文件的程序

mount_udf - 挂接UDF文件系统

mountctl - 控制被挂接的文件系统的日志或其他特性

pctrack - 通过倾倒程序计数器跟踪内核记录的数据

rconfig - 远程配置客户端/服务器

rcrun (and family) - 管理启动脚本 (rcenable/rcdisable)

resident - 生成一个动态二进制文件的常驻内存副本

varsym - 获取和设置变量的符号连接

vkernel - 虚拟内核架构允许内核在用户空间运行

wmake - 在buildworld环境中构建DFBSD源代码

DFBSD资源

评论

(欢迎大家发表自己的评论)

DragonFly相对而言发展时间最短、开发者数目也比较少,而且由于采用了大量新的技术,导致开发量比较大。目前开发者主要关注于功能的实现,在移除giant-lock、对新硬件的驱动支持、协议栈优化等很多细节方面都落后于FreeBSD;但是作为对未来SMP发展不同的视点和对内核设计方面崭新的尝试,DF还是很值得关注的,期待明年年初2.0版本的推出。 —–moremore2(07年11月22日)

/data/vhosts/wiki-data/pages/os/dragonflybsd.txt · 最后更改: 2007/12/17 05:14 由 delphij