当前位置:首页 > CN2资讯 > 正文内容

[搜片神器]使用C#实现DHT磁力搜索的BT种子后端管理程序+数据库设计(开源)种子搜索神器 磁力

20分钟前CN2资讯


谢谢园子朋友的支持,已经找到个VPS进行测试,国外的服务器:http://www.movih.com   大家可以给提点意见...

先直接上程序界面,了解整体工作流程是什么样子的,求服务器进行挂机测试,需要固定IP,空间大概需要10G左右(主要是BT种子占用空间过大),最好有SQLSERVER来做为存储数据库,目前采用的是ACCESS数据库做为测试,怕后期数据过百万,对网站进行查询操作很慢。

如果程序运行的时间够长,基本上网络上的种子都会过来,相当于搜片神器了.

也提供ASP网站的访问模式:

 

正在运行中的状态:

本次主要介绍对DHT磁力搜索的HASH文件进行处理操作流程。

后台处理程序主要采用C#里面读取文件类来进行读取,目前文件格式分为两种,一种是从​​http://torrage.com/sync​​下载回来的文件进行处理,

另外一种是采用C++程序对DHT网络中的HASH文件进行搜索存储的自定义文件,

里面有HASH值和时间IP等信息,可以通过这些IP值分析出对方电脑上有哪些BT文件,当然这里面的HASH值对应的文件对应的可是当前活跃在网络上的文件,与上面网站上下载的固定的文件值有区别,

有了这些IP值,个人也可以做些行为分析方面的工作,比如哪些城市的IP在下载些什么类型的文件。

 

下面介绍下数据库方面的设计工作:

1.初步考虑到SQLSERVER对自己电脑工作速度会有影响,没有安装SQLSERVER数据库,采用ACCESS来进行处理操作;

2.ACCESS数据库每个表的大小最好控制不要超过4G,所以设计每表不超过100百万条数据;

3.对BT种子文件进行解析后,提取里面的文件名字,按照文件类型存储到不同的表中,主要分为6大类,电影,音乐,图片,书箱,程序,其它类,

4.由于BT种子里面语言对应的不一样,有中文,英文,日文,韩国等语言,对于搜索界面如果全部存储到一块,没有什么问题,但会影响查询速度,因为中国人一般喜欢用中文查询,如果想查日文,对选项进行选择一下,这样会对所有的表查询都会有很大提高,因为每个表的文件都基本上针对几种语言;

5.对于BT种子里面的文件列表直接采用100百万一个表,如果超过了,直接存储第二块表,因为主表里面有存储自己的文件列表在哪个表的关键字段;

6.另外对数据库信息也比较严谨一些,由于种子文件里面有很多广告信息,比如视频种子里面经常有网站URL,TXT,MHT等信息链接,程序经过初步判断直接不存储到文件表数据库中,占用数据库空间,影响查询速度,另外查询出来显示列表也不好看.

7.对于一个种子里面经常有>200多个的种子文件也没有进行存储,一个种子有很多文件也比较浪费空间,再说这种种子保存下来基本上都没什么意义,直接PASS;

8.对于文件名里面有网站信息的也采取的过滤措施,对查询有很好帮助.

数据库表设计列表:

存储DHT文件名字的表:

存储种子文件列表:

 

--------------------------下面先介绍一下DHT的工作原理--------------------------------

DHT网络本质上是一个用于查询的网络,其用于查询一个资源有哪些计算机正在下载。每个资源都有一个20字节长度的ID用于标示,称为infohash。当一个程序作为DHT节点加入这个网络时,就会有其他节点来向你查询,当你做出回应后,对方就会记录下你。对方还会询问其他节点,当对方开始下载这个infohash对应的资源时,他就会告诉所有曾经询问过的节点,包括你。这个时候就可以确定,这个infohash对应的资源在这个网络中是有效的。

关于这个网络的工作原理​​​​。

获取到infohash后能做什么?关键点在于,我们现在使用的磁力链接(magnet url),是和infohash对应起来的。也就是拿到infohash,就等于拿到一个磁力链接。但是这个爬虫还需要建立资源的信息,这些信息来源于种子文件。种子文件其实也是对应到一个资源,种子文件包含资源名、描述、文件列表、文件大小等信息。获取到infohash时,其实也获取到了对应的计算机地址,我们可以在这些计算机上下载到对应的种子文件。

在获取到infohash后,从一些提供映射磁力链到种子文件服务的网站上直接下载了对应的种子。

http://torrage.com
https://zoink.it
http://bt.box.n0808.com


-------------------------我们后台处理程序就从上面进行种子的下载工作---------------------------

下面重点介绍下我们程序的模块设计:

1.H31SQL类主要方面进行ACCESS和SQLSERVER数据库操作进行初步封装的一个类;

2.H31Debug主要是日志输出类

3.H31Down主要是下载BT种子文件进行的类;

4.TorrentFile类是用来解析BT种子文件类,由于目前可能有的BT种子格式对不上,有些文件解析不上;

5. MainForm主程序界面。

------------------------------------

下面介绍程序处理数据的主要流程:

 1.读取本地文件,采用正则表达式对数据进行提取


  2.从网站下载BT种子文件来进行处理


3.通过BT文件解析类来读取文件名和列表

4.通过正确正则表达式过滤掉WWW. BBS. 等网站信息,因为这样会影响搜索结果.


5.判断文件名是中英文,日文等信息存储到不同的表中;



    你可能想看:

    扫描二维码推送至手机访问。

    版权声明:本文由皇冠云发布,如需转载请注明出处。

    本文链接:https://www.idchg.com/info/19239.html

    分享给朋友:

    “[搜片神器]使用C#实现DHT磁力搜索的BT种子后端管理程序+数据库设计(开源)种子搜索神器 磁力” 的相关文章

    中国电信CN2目录价格解析——助力企业高效互联

    在互联网经济飞速发展的今天,企业对网络的需求早已不限于简单的网页浏览和邮件传输。无论是跨国企业、互联网公司,还是电子商务平台,都需要一个稳定、高速、低延迟的网络环境来支撑业务的高效运转。而中国电信CN2作为国内领先的通信网络服务之一,凭借其优质的网络资源和服务,成为众多企业的首选解决方案。但对于初次...

    存储VPS:高效处理大量数据,灵活配置,按需付费

    什么是存储VPS 存储VPS是一种专门为处理大量数据而设计的虚拟专用服务器。它提供了广泛的磁盘空间,并且通常针对高容量存储需求进行了优化。无论是个人用户还是企业用户,存储VPS都能满足他们对数据存储的高要求。这种服务器不仅具备强大的存储能力,还提供了灵活的配置选项,用户可以根据自己的需求选择合适的硬...

    Windows SSH 连接云服务器的安全与便捷指南

    当我谈到SSH时,首先想到的是它的安全性和便利性。SSH,或者说安全外壳协议(Secure Shell),是一种加密网络传输协议。它的主要目的是在不安全的网络环境中,提供一个安全的传输机制。这对远程管理和数据传输尤其重要。实际上,SSH相当于在客户机和服务器之间创建了一个安全的隧道,确保我发送和接收...

    云计算技术在犬类健康管理中的应用与创新

    云计算服务在犬类健康管理中的应用 在现代社会中,科技的发展为我们的生活带来了许多便利,尤其是云计算技术提供了不可或缺的支持。在犬类健康管理中,云计算的应用同样发挥着至关重要的作用。这一技术不仅能帮助宠物主人更好地管理爱犬的健康状况,还可以提高宠物医院的服务效率和医疗水平。 首先,云计算技术的核心在于...

    VPSCheap评测:低价VPS服务的最佳选择与性能分析

    VPSCheap的概述 我第一次听说VPSCheap的时候,是在一个热闹的VPS论坛上。这个成立于2010年的主机商,主要提供KVM型VPS服务,其特点是低价格和无限流量。从那以后,我对VPSCheap的关注逐渐加深。它的数据中心位于美国达拉斯,给不少用户带来了良好的使用体验。论坛上的用户在讨论各自...

    Digital-VM优惠活动揭秘:享受五折折扣和稳定续费

    Digital-VM优惠概述 Digital-VM简介 Digital-VM是一家专注于提供基于KVM架构的VPS主机服务商,凭借其强大的服务器性能和丰富的网络资源,已经逐渐在市场中站稳了脚跟。如果你在寻找高可靠性、灵活配置的VPS主机,Digital-VM绝对值得一试。它在全球多个地区建立了数据中...