一般技术参考目录

来自Wired
跳转到导航 跳转到搜索

名词

※ 无顺序

PCND

  CDN技术是将资源分布在不同的服务器中,用户访问网站时,从最近(连通性最好的)CDN的节点服务器获取资源,以达到加速访问、减少网站主机压力的效果。

  通常说的PCND是则让普通用户成为节点,将需要的内容缓存到硬盘中,并利用空闲带宽上传数据(内容分发),最后获得佣金的行为。

  但通过个人宽带盈利的行为是不被运营商所允许的,因此运营商会或会停用、限速用于PCDN的账户——这没什么,但问题在于运营商的判断标准,很多运营商(点名河南联通)并没有识别用户流量类型的技术(或单纯懒政),而是一刀切所有高上传量的用户宽带,将上行限制到5-10Mbps以内,甚至不予申诉。

  这对我这种BT/PT、向网盘大量传输数据的用户来说绝对是无妄之灾。而且PCDN用户与运营商的斗争从未停止,甚至很多PCDN用户为了中和自己的上下行流量比例而侵入了BT社区[1],是绝对的毒瘤——当然,它们有时也披着“边缘算力存储服务器”的外衣,但本质上就只是PCDN。

[1] | 关于近期anacrolix等无限下载的BT工具的说明与对策:https://docs.qq.com/doc/DQnJBTGJjSFZBR2JW

 

清零盘

  通过一些方式(不知道哪来的技术、厂商流出的清零工具[1]等)清除SMART信息(包含写入的数据量、通电时间、坏道情况等),以伪装成新盘欺骗小白。


  不过清零与质量并无直接关系,只是隐去了硬盘的实际状态,奸商是否清零硬盘也是取决于是否有清零工具,是有些硬盘可以清零(例如,Seagate SMART RESET (NEW VIDEO) (how-to-reset-smart-results) 、HDD Toshiba, сброс SMART в Victoria),但并非所有硬盘都可以,例如西数HC550截止目前(2024-12)无任何流出清零工具的迹象,不过市面上的矿盘也都是1w+小时的了。

[1] | 例如2022年技嘉“泄露”了SSD清零工具:ssd_utility_firmware_update_tool_EGFM13.2,据网友讨论波及了使用群联E16主控的很多非技嘉品牌SSD,但该工具似只能重置写入量不能重置通电时间。

 

矿盘

  随着虚拟货币的流行,矿卡一词映入我们的视野,简单来说便是通过计算区块获得虚拟货币[1],需要显卡高负载的持续工作,压榨硬件性能,直到收益下降然后抛售,显卡挖矿流行的那段时间疯狂到我将花800元购买且用了一年多的rx588以2550元的价格出售了——虽然代价是我没有新显卡用,只能用RTX960开最低画质玩地平线4。

  后来又流行起了奇亚币,它使用硬盘挖矿[2][3],于是那段时间又没硬盘可买了;还有几乎从未中止过的#PCND。但与矿卡不同,它们需要的只是存储空间。

  以奇亚币为例,挖奇亚币涉及到plotting(对应写操作)及farming(对应读操作),对机械硬盘寿命有影响的非正常操作是大量且频繁的写入资源,plotting占这条,但机械硬盘的写入效率相对于固态太低了,如果用机械硬盘写数据,那收益也都归别人了,因此写入的操作都是用固态硬盘完成(所以二手固态别随意买),而后将最终需要用来farming的数据写入机械硬盘,读数据对机械硬盘(特指以HC550为首的高性能企业硬盘)的损害相对较小;PCDN亦如此,少量的写入,更多的读取(但PCDN看情况,如果存储的是热门资源,如替流媒体平台分流,写入相对就是少的,但如果需求变化频繁,负担也会越大,这个过程是不可控的)。

  所以在挖矿与边缘计算(PCDN)流行趋势显颓的那段时间的矿盘非常吃香,毕竟上hc550企业硬盘(及其他同类如希捷银河X16/8)参与挖矿/PCDN的通常都是与某些公司签协议,把机器托管到机房内,生产环境不会很恶劣,但比同样环境下服务器/数据中心退役的硬盘写入量少太多了。

  但是随着挖矿的没落,二手盘被再分配见底,但正常需求仍旧未减、厂商不积极生产、PCDN抬头,硬盘的价格也是水涨船高。

[1] | 挖矿原理:https://liaoxuefeng.com/books/blockchain/bitcoin/mining/index.html

[2] | 通俗解释:Chia币为什么能用硬盘挖矿?:https://www.qianhei.net/paogenwendi/246.html

[3] | 硬盘危机——Chia 挖矿背后的原理与技术细节(一):https://dgideas.net/2021/hard-drive-crisis-the-principles-and-technical-details-behind-chia-mining-i/

 

硬盘体积

厂商与系统计算空间容量的方式差异、体积单位的混用所惹的误会引来了不少的矛盾[1]

体积计算基础:

  • 厂商:10进制;
  • Windows:2进制;

10进制与2进制计算方式的差异:

  • 10进制(x1000):1 TB = 1000 GB = 1,000,000 MB = 1,000,000,000 KB = 1,000,000,000,000 Byte
  • 2进制(x1024):1 TiB = 1024 GiB = 1,048,576 MiB = 1,073,741,824 KiB = 1,099,511,627,776 Byte

这么一换算硬盘空间直接“缩水”了9%:

  • 体现到1TB硬盘上便是:1 TB = 1,000,000,000,000 Byte = 976,562,500 KiB ≈ 953,674 MiB ≈ 931 GiB;
  • 体现到16TB硬盘上便是:16 TB = 16,000,000,000,000 Byte = 15,625,000,000 KiB ≈ 15,258,789 MiB ≈ 14,901 GiB ≈ 14.55 TiB;

除了厂商与文件管理系统的计算差异,单位的混用也非常严重,例如macOS、部分LInux发行版的桌面环境以1000进制及XB显示容量,而上至windows以1024进制计算却仍旧以XB而非XiB显示容量,下至笔者日常生活中也并未严苛单位的用法。

[1] | b、B、KB、Kib、MB、MiB、GB、GiB、TB、TiB的区别:https://www.cnblogs.com/Silence-1018/p/17556885.html

 

网络速度

#硬盘体积般也是易混淆、误解的。

网速的单位通常是Xb(bit per second,缩写为bps),而体积的单位是XB(Byte);换算关系为 1 XB(byte) = 8 Xb(bit)。例如 10 MB/s 表示每秒传输 10 Megabyte 即 10MB 的数据,而 10 Mbps 代表每秒传输 10 Megabit 即 1.25 MB 的数据。

除了计量网速外,还常用于表示影视的码率,视频的码率是 10 Mbps 则代表平均每秒传输 1.25 MB 的数据。

  • 码率特殊一点,通常计算码率是将 视频体积/时长*8=码率 计算的,例如10GB、1h的视频码率便是22.22Mbps,这属于平均码率。这种称谓区分是对应了编码方式:固定码率(CBR)、可变码率(VBR)[1]

[1] | 固定码流 可变码流:https://www.cnblogs.com/ostin/p/9917382.html

 

Base64

  Base64是一种编码方式,将二进制数据编码为由64个ASCII字符(0-9、26个大/小写英文字母、+/)组成的字符串。可以用于传输文本、图片等各种数据。例如浏览器拓展SingleFile保存的网页副本就会将图片进行base64编码再保存字符串而不是下载图片文件。

  也可以通过直接通过浏览器解码base64,根据文件属性的不同设置好MIME类型,例如网页:data:text/html;base64,xxxxxxx,图片:data:image/png;base64,xxxxxxx,就可以自动解码并渲染为网页或图片。

  编解码网站可直接搜索:PNG/xxx to Base64

 

子域名

如“wiki.scio.icu”中,“.icu”是顶级域(也称一级域名);“scio”是二级域名,购买域名就是购买它们的组合;“wiki”是三级域名,这个是自定义且无限制的,如果需要,可以继续创建四级域、五级域…

根据网上听来的消息,域名原型应当是:wiki.scio.icu.icu. 是一级域名/顶级域名,由注册icu后缀的人持有,它向域名代理商授权xxx.icu.的贩售权限,反正挂上.是可以正常解析,至于是类似于中文按英文.解析的防呆设计还是写到了哪个规范文档中、某些历史遗留因素我就不知道了。

不过我注意到很多人将“xxx.xxx.org”称呼为“二级域名”/“免费提供二级域名”。对此反正按照非专业的逻辑来,我也认为如此,scio.icu是一级域名,至于.icu那是后缀(或者零级也挺符合对IT行业的刻板印象的),但既然知道了这个冲突,为了避免歧义,我就尽量通称为“子域”;不管被称呼为什么,反正我不是专业的,我认为目的只是使用的话,能理解什么意思就行。

 

CF盾

cloudflare提供的DNS代理服务。

优点:

  • 隐私:访客只能知道cf的ip,而不知道你服务器的真实ip,但注意在服务器配置禁止使用ip直接访问不然隐私效果就名存实亡了;
  • 防攻击:获取不到真实ip,攻击的只是cf的ip,而cf根本d不动的,但不是防所有类型;
  • 加速:原理似乎是有一部分内容被cf缓存,用户访问网站,cf直接呈现缓存的内容,不仅可以节省服务器的资源耗损,而且cf的连通性/延迟一般也比普通服务器好,但不包括国内
  • 免费:cf财大气粗)。

缺点:

  • CF很多的ip(绝大多数公开的ip段)都被墙了或者国内访问速度很慢,所以对国内来说反而是“减速盾”,有个半优半喜的好处:
    • 优点是可以优选cf IP,将连接性好的IP 写入hosts文件,所以了cf的站逻辑上不存在被墙;但缺点是不是所有用户都会如此操作/知道有这么个操作。
  • 对VPN不友好,部分廉价节点访问套了cf的站会卡在检查环境上很久。

 

DDoS

※ 参考维基百科:Denial-of-service attack

非常朴素和暴力的攻击方式,就是世界各地的设备(肉鸡)向目标发送大量垃圾请求,占满服务器的带宽、性能,使其他正常的访客无法访问服务(如果流量是付费的,那么还会让目标承受巨大的财产损失)。

另一种(应当是DDoS的子类)难防的是CC攻击(Challenge Collapsar),就是通过各种手段(ua、请求的资源、IP)一切都伪装成了正常请求,难以分辨流量(IP)到底是恶意攻击还是正常访问。或许在防御时会让正常用户的体验受损。

 

静态与动态网站

具体的我也说不清,简单来说:

  • 静态网站就是单纯的html文件[1],比如系列站点的主站的“hxxps://scio.icu/index.html”,要想修改网站内容,需要手动编辑html文件(直接从服务器编辑,或本地编辑好传输到服务器)
  • 动态网站则具备交互性、实时变动等功能,你目前看到的html页面是服务器在你访问时实时生成的,然后再推送给浏览器。如果选择了其他的参数,内容也会改变,比如“hxxps://wiki.scio.icu/index.php?title=页面标题&action=history”,“?”后面跟着的就是参数,“title=xxx”指页面的标题,“&”是链接不同参数的符号,“action=history”指历史页面,可以查看历史编辑记录。服务器中并不存在这些具体的页面,信息都存在于数据库中,你访问的网站含什么参数(假设参数有效),它输出什么信息。

简单来说:

  • 动态网站是用php/asp/jsp这类脚本工具提供(与页面/服务器)交互与实现高级功能、mysql/PostgreSQL这类数据库管理系统存储网站资源(存储的是字符串,不包含文件),前者动态调用后者的资源组织出需要的数据并输出html文件给浏览器;
  • 静态网站是html+css+js这些静态资源组成的(静态网站生成器也是输出这些静态资源),虽然js可以提供部分交互功能,但总归是在模拟动态操作而不是动态资源。
  • 静态网站就像打印出来的文件(访客)只能看不能修改;动态网站就像电子稿,根据需要调整输出的内容,还可以直接在页面上修改内容。
  • 这只是简单的区分手段,更简单的是将其理解为:动态网站可以前台(线上)编辑内容,而静态网站只能后台(本地)编辑内容。
    • 比如4chan、lainchan等讨论版本质上就是动态网站,但是使用了一些静态网页生成器,用户提交新内容后,服务器输出新的静态页面,因为访问静态页面的速度和资源占用都是有极大优势的参考,mediawiki也可以通过文件缓存实现这一效果。
  • 静态网站的优点是响应速度快、资源消耗少。缺点对于记录生活的个人博客(编辑频繁),或体量大的站点(内容相互引用、需要建立较为复杂的联系)并不友好,甚至会影响创作热情。

[1] | 包含css等样式文件和js脚本,后者可以提供一些交互功能,但不与数据库交互,交互效果也都是提前设定好的事件。

 

邮件管理客户端和邮件转发

邮件管理客户端,如Thunderbird,可以接管邮箱的收发信,通过SMTP(发信)、IMAP(收信)或POP3(转发(不会影响原邮箱的状态))来实现,具体邮件提供商的smtp/imap地址、端口可以查看官方文档或者询问客服,比如阿里云(域名邮箱)的是:

  • 收件服务器地址:
    • POP 服务器地址:pop.qiye.aliyun.com 端口110,SSL 加密端口995
    • IMAP 服务器地址:imap.qiye.aliyun.com 端口143,SSL 加密端口993
  • 发件服务器地址:
    • SMTP 服务器地址:smtp.qiye.aliyun.com 端口25, SSL 加密端口465
  • 如果邮件服务器/端口被墙,或许能收信,但无法发信(可以本地:telnet ip/url port测试,在线工具:国内/国外,即使给ip设置白/黑名单、开了全局、改DNS都无济于事,暂不知具体原因。

邮件转发:如可以将阿里云邮箱收到的邮件,转发到谷歌邮箱中。操作:

  • 在谷歌邮箱的设置页面的“查收其他帐号的邮件:”栏选择“添加邮件帐号”
  • 输入阿里云的邮箱地址,比如我的是“scio@scio.icu”
  • 默认的选项是“从我的其他帐号导入电子邮件 (POP3)”(另一个是灰色的,不支持)
  • 输入用户名(重复一遍邮箱地址)、密码(该自建邮箱的密码)、POP服务器/端口(见上面列出的地址);剩下四个复选框是体验上的,想开就开不想开也不影响使用(如果开启了ssl,即可端口换成995)。

 

操作

不可播放引用的youtube视频

解决方案:使用https或localhost

在本地网站引用视频时遇到的问题,起初以为是版权限制,但是越想越不对劲,嵌入代码又没什么特殊的,IFrame Player API页面又什么提示没有,但有很多案例(案例1案例2),一开始没注意到什么关键信息,一是没朝这方面想,二是提问者跟我的情况也不太一样,然后无意间看到:这个回答,才知道了答案。因此可以配置本地ssl证书,或者直接用localhost代替127.0.0.1。

从url保存视频到youtube播放列表

youtube原生支持便捷创建播放列表的功能:https://www.youtube.com/watch_videos?video_ids=AwyRYse4kss,QoitiIbdeaM,drlB2RT_XiA 一直添加id即可,访问此url会自动创建播放列表,但上限为50个。对此可以自行批量转换或使用其他人现成的工具

安装拓展:Multiselect for YouTube™Chrome/Firefox);

访问创建的播放列表使用此url:https://www.youtube.com/playlist?list=TLGG-RYNtSKMoDgyNzA4MjAyMw

  • 注意播放列表的id是“list=xxxxx”;视频的id是“v=xxxx”;
  • 默认跳转的url这个拓展无法识别播放列表内的内容。

点击屏幕右上角的拓展按钮,全选根据需要保存到播放列表即可。

tg保存设为不可转发群组的图像

※ 或具有时效性。

鼠标左键点击图像,在图像展开的过程中按下shift+鼠标右键图像,即可唤出正常的右键菜单栏,点的慢点没关系,不慢太多就行;

Web端测试:firefox系可行,chrome不可行,Chromium系是否都不可行不清楚,据反馈说桌面版客户的也可行。

使谷歌文档可翻译

url后添加/mobilebasic(若有/edit,替换掉即可),因为现有主流翻译插件(如TWP)无法翻译这种被框住的里头的内容。

一个网卡设备配置两个不同网段的IP地址

 

创作

批量删除文档中的各种标点符号

通过正则表达式,所以基本上市面的文本编辑工具都支持。

  • 在替换的工具栏勾选“正则表达式”,输入“[,。、“”《》()—?!:''…=【】]”替换的内容留空就行,就能一次性删除方括号内的字符;
  • 示例是常用的中文字符,我是用来统计字数,因为一般的统计功能可以将英文字符忽略,但中文字符无法与文本区分。

用Unicode码输入字符

Fcitx输入法:默认是“ctrl+shift+alt+u”唤醒u码输入。

  • u+3010
  • u+3011
  • u+203b
  • u+3000 

可以通过站长工具>Unicode编码Unicode 15.0 字符代码表之类的地方查询u码。