你乐谷
首页 > 图文

P2P 点对点 下载技术基本原理

2023-03-16 来源:你乐谷

P2P 点对点 下载技术基本原理

本文核心词:技术,网络,BT,服务器,原理,上传,下载,基本,点对点
P2P(点对点)下载技术原理简介
各位想必都用过BT下载吧?现在的BT下载可以说是继局域网、ftp、http之后最广泛使用的文件分享和传播途径,可以说已经融入了广大网民的生活中。bt,全称BitTorrent,是一种P2P下载方式。常见的P2P除了bt就是emule
为什么P2P可以在如此短的时间内风靡世界呢?这是为什么呢??? 这里就要从它的原理说起,在介绍P2P的原理之前,有必要先解释下传统的http下载。
传统的http下载是从服务器(sever)上直接复制数据给客户端(PC),这种传输的快慢有带宽的限制。[什么是带宽?比如你家用的是2M ADSL,那么带宽就是2M,此处的2M指2Mbps,就是250kb/s(2000/8)。想想你下载的时候达到过带宽吗?
由于一般服务器连接的客户端不止一个,服务器的带宽就会被分享。当然服务器的带宽比自家大多了,一般都是光纤;没有特殊限制的话,服务器的带宽是等分的。
假设服务器的带宽是100M,即12500kb/s,有100台客户端连接,那么每一台分享到的带宽就是125kb/s,可见客户端的带宽没有完全发挥,为了弥补这种状况,flashget(网际快车)发明了多线程下载,这里就不深究了。
但是现实中,情况显然严重的多,大型软件下载站的访问量有多少大家可以百度百度。网民越来越多,这种情况需要改变。P2P就是在这种情况下诞生的。
P2P下载时,服务器(sever)不再担任以前的http下载中服务器的角色,他只负责将文件的基本信息在客户端之间中转,本身并未存放任何文件。P2P软件将文件被分成若干块,这里假设为A~Z块,客户端可以先下载K段再下载别的,没有固定的顺序,只要等最后文件被“填满”就完成了
这样的好处就是,http下载中宕机了你就下不全了(虽然也有断点续传,不过现在随机地址越来越多了-- ),使用P2P你就完全不必担心这一点,即使你没有M段,只要等有M段的人传给你就行了,而且在别人传给你的同时,你也在将自己完成的部分分享给没有此区块的人,这样就是分享。当然单组客户端之间的传送速度是非常慢的,但是连接的用户数越多,理论上一台客户端连接的用户数就可以增多,下载速度就这样提起来了,既充分利用了带宽又保证了完整性。
下面是补充部分了:
1.在P2P传输中有“种子”这种说法。所谓的“种子”,就是指那些已经将文件下载完成的人,他们拥有全部的区块。发布资源的人自己就是一个最原始的种子,最先连接的客户端得到的块都是从他这边来的,直到新的种子出现。当种子消失时会发生两种情况,一是缺少区块,剩下的客户端最多下载到完全相同的进度;另一种就是区块正好完整,只不过分布在不同的客户端上而已,这样下去就会有人下载完,成为种子。所以,种子可是很重要的,大家如果下载完了一定要自觉做种,这是P2P世界默认的准则。
2.有关上传。在连接数能保证的情况下,下载的速度就要看你的带宽了。但是,如果你限制上传,你的下载速度可是会受到影响的哦。一般可以使用软件自动检测下可用上传/下载速度,然后将稍稍限制一下上传,这样在下载同时浏览网页也不会太卡。
常用语
No.1 求种
“求种”一词常见于影视类论坛或者成人网站, 这里的“种”是指种子文件,也就是Torrent文件。
No.2 Hash(哈希算法)
哈希算法将任意长度的二进制值映射为固定长度的较小二进制值,这个小的二进制值称为哈希值。哈希值是一段数据唯一且极其紧凑的数值表示形式。如果散列一段明文而且哪怕只更改该段落的一个字母,随后的哈希都将产生不同的值。要找到散列为同一个值的两个不同的输入,在计算上是不可能的。
No.3 Tracker
是指运行于服务器上的一个程序,这个程序能够追踪到底有多少人同时在下载同一个文件。 客户端连上tracker服务器,就会获得一个下载人员的名单,根据这个,BT会自动连上别人的机器进行下载。它是提供bt的服务器。把文件用bt发布出来的人需要知道该使用哪个服务器来为要发布的文件提供tracker。由于不指定服务器,BitTorrent采用BT文件来确定下载源。
tracker服务器是BT下载中必须的角色。一个BT客户端在下载开始以及下载进行的过程中,要不停的与tracker服务器进行通信,以报告自己的信息,并获取其它下载client的信息。这种通信是通过HTTP协议进行的,又被称为tracker HTTP协议,它的过程是这样的:
client向tracker发一个HTTP的GET请求,并把它自己的信息放在GET的参数中;这个请求的大致意思是:我是xxx(一个唯一的id),我想下载yyy文件,我的ip是aaa,我用的端口是bbb。。。
tracker对所有下载者的信息进行维护,当它收到一个请求后,首先把对方的信息记录下来(如果已经记录在案,那么就检查是否需要更新),然后将一部分(并非全部,根据设置的参数已经下载者的请求)参与下载同一个文件(一个tracker服务器可能同时维护多个文件的下载)的下载者的信息返回给对方。
Client在收到tracker的响应后,就能获取其它下载者的信息,那么它就可以根据这些信息,与其它下载者建立连接,从它们那里下载文件片断。
No.4 Torrent文件
Torrent文件本质上是文本文件,包含Tracker信息和文件信息两部分。Tracker信息主要是BT下载中需要用到的Tracker服务器的地址和针对Tracker服务器的设置,文件信息是根据对目标文件的计算生成的,计算结果根据BitTorrent协议内的B编码规则进行编码。它的主要原理是需要把提供下载的文件虚拟分成大小相等的块,块大小必须为2k的整数次方(由于是虚拟分块,硬盘上并不产生各个块文件),并把每个块的索引信息和Hash验证码写入.torrent文件中;所以,.torrent文件就是被下载文件的“索引”。
Torrent文件通常很小,大约几十K、几百K大小。
根据BitTorrent协议,文件发布者会根据要发布的文件生成提供一个.torrent文件,即种子文件,也简称为“种子”。
No.5 磁力链接
简单的说:类似下面这样以“magnet:?”开头的字符串,就是一条“磁力链接;确切的说:“磁力链接”的主要作用是识别【能够通过“点对点(即:P2P)”下载的文件】。这种链接是通过不同文件内容的Hash结果生成一个纯文本的“数字指纹”,来识别文件的。而不是基于文件的位置或者名称。
范例:【magnet:?xt=urn:sha1:YNCKHTQCWBTRNJIV4WNAE52SJUQCZO5C】
众所周知,BT下载速度不够稳定,当断种时则无法完整下载。但是,这还不是最严重的。从2010年开始,BT下载遭遇到了“更大的困难”——很多的BT服务器被关,不仅很多种子文件无法找到,BT Tracker服务器也断开解析工作,这就使得BT下载成为很大的难题。磁力链接很好地解决了这个问题。磁力链接的问世与大行其道,标志着BT 1.0时代已经过去,BT 2.0 时代已经到来。
磁力链接是一种特殊链接,但是它与传统基于文件的位置或名称的普通链接(如
类似【magnet:?xt=urn:sha1:YNCKHTQCWBTRNJIV4WNAE52SJUQCZO5C】这样以“magnet:?:”开头的字符串,就是一条磁力链接,很容易辨别。

猜你喜欢