OSINT項目章程

出自Wired
跳至導覽 跳至搜尋

前言

  在互聯網的領域,「情報」永遠是最重要的,非技術領域尤甚。當然,識別「情報」的優劣與相性同樣重要,適合自己的才是恰當的。OSINT本意是「開源情報」,可以泛指一切出現在公共領域的信息,並由此為基礎獲取、組織、分析出自己所需要的東西。傳統的「網絡社會工程學」(從反CP的角度,看OSINT技術)是如此,根據天文地理知識搭配衛星地圖推斷圖片拍攝地點亦是如此。但在這裏,我主要指互聯網站點的情報信息項目,其中按照領域與社區陣地索引了我互聯網生涯收藏的各路適宜公開的站點。

  新章程因精力問題由原OSINT項目規則精簡而來,待我精力充沛時原規則也將捲土重來,只是那可能的未來非常遙遠,故會用新結構維護。

  這一過程中或會使內容被分化,喪失了「項目初衷」的一站式索引的便利,我對此無能為力。

  2024年末的大更新中,OSINT項目無疑是變動最大的,在此之後我將優先於內容產出,而非結構,因為顯而易見的原因,以我欠費的精力、微末的技術,是無法以個人之力撐起為集體協作設計的項目的,尤其是在設計時我不具備技術實現的能力從而不確定設計的方向是否有偏差(比如某些我認為後續可以用腳本簡單實現的功能是否真的容易實現?某些我認為實現難度比較大從而用低技術/無技術方案替代是否其實很容易實現?選用的工作環境及標記方式是否有更好的策略從而不僅更規範還更容易移植?),所以在脫離了家裏蹲生活後,我想長續發展該項目就必須做出變動,直到項目成為多人協作的、直到我擁有技術或擁有技術的人加入該項目從而站在技術的肩膀上設計真正高效的策略。在那之前,請您耐心等待,一味的統一或重複安排對我來說只是負擔,因此OSINT項目會陸續被分化出很多專題,他們的設計策略或因此不統一及規範,無法使您通過一個文件獲取格式一致的全部內容。

 

項目主體

項目分支

OSINT項目

情報與資訊存檔

自編輯參考建議

工作文件(.MD)

 

政策規則

分發政策

現行分發政策:

  • 有內容更新的前提下每月分發 0~1 個工作文件合輯。包含內容如下:

主項:

  • osint.md(主要)

社區包:

  • chan.md(內容上限而更新停滯)
  • reddit.xlsx(平台拋棄而更新停滯)
  • discord.md(邀請制環境惡劣而更新停滯,計劃有序啟動)
  • telegram.md(使用傾向梗圖而更新停滯,計劃有序啟動)

輔項:

  • 待驗證內容.md (以工具為主的未實際使用過的內容,正考慮移植到替代方案專欄)
  • 網站墳場.md (逝去的站點/服務,極度需要重置ui)
  • b.txt (隨機站點,主要為博客,但前幾個版本或不囊括)

其他:

  • 集結號(在第一次公示時便放出了,只是未作廣泛告知導致存在感很弱,考慮到性質問題仍舊不線上公示,而是隨分發包傳播,正在計劃有序啟動)

注意,所有文件均不包括R18及更甚內容站點,亦不會以任何形式交換、收容,對此請參考Wiki:宇宙免責聲明#OSINT項目

 

版本類型

.MD版本

工作文件(源文件)即.md文件(個別為表格或純文本)。

.html由源文件粗暴轉換而成,故只公示用不存檔。

書籤欄版本

wiki:User:Cronfox提供之腳本通過.md文件OSINT現行基本編寫規則轉換而來。

下載腳本:https://scio.eu.org/WIKI/备份/附件/OSINT转换工具.7z

使用方式(僅測Linux系統):

  • 解壓文件並於命令行進入工具文件夾內;
  • 運行 npm i 安裝依賴;
  • 運行 node index.js osint.md 生成 osint.md.json 文件;
  • 運行 node builder.js osint.md.json 生成 osint.md.html 文件;
  • 通過瀏覽器的書籤管理器導入osint.md.html即可。

腳本提供人註:parser.js, example.html和 output.json 源於 https://gist.github.com/devster31/4e8c6548fd16ffb75c02e6f24e27f9b9

編者註:由於我對書籤欄沒有任何需求,自己也未實際使用該版本,自OSINT項目創辦以來至僅確認有一人需要此版本,因此缺少實際體驗報告及優化方向;由於OSINT項目在編寫時並未充足考慮轉為其他格式的兼容性、我個人編寫.md文檔時本身就不那麼規範、OSINT項目有大量題材獨立為單獨的項目等原因也缺乏妥善優化的根基。因此您可以根據需求選擇是否使用此版本,並歡迎反饋使用體驗、待優化部分、優化後的新腳本。

 

基本規則

目前實際僅作用於OSINT.md工作文件。

內容規範

  • 一級目錄:一级目录-??X分类-一级目录标题
  • 二級目錄:二级目录-??Y-二级目录标题
  • 三級目錄:三级目录-??Z-三级目录标题
  • 四級目錄:四级目录-??A-四级目录标题
  • 五級目錄:五级目录-??B-五级目录标题
  • 六級目錄:六级目录-??C-六级目录标题
  • ……目錄以此類推
  • 正文:网站标题 | 简短介绍 标识区域(若有) | hxxps://网站url.com/ | 较长介绍/补充(若有)

內容規範(示例)

  • 一級目錄:一级目录-04X专栏-计算机/硬件/DIY专区
  • 二級目錄:二级目录-08Y-硬件/DIY
  • 三級目錄:三级目录-06Z-装机/硬件
  • 正文:Build Guides | 装机指南/预演/社区 | hxxps://pcpartpicker.com/

部分符號註釋

  • ??:當前分級下按順序的編號(一級目錄較為特殊,原始版本是按順序來的,考慮到分發改成了更容易理解的順序但序號保留)
  • 序號:X、Y、Z、A、B、C、D……W按照分級的增進而向後沿用,但一般到六級就是極限了。
  • 分類:一級目錄專有,原為分類進行分組的一種標識,後改變了分組邏輯,但標識保留,用於標識該分類的站點基本種類/屬性。

部分區域註釋

  • 【網站標題】以官網名稱為主,若過長可精簡,過長的英文可自行翻譯,但修改後的名稱與源語言不一致應當加以語言標識。
  • 【簡短介紹】重在精煉、簡要,若做不到可按空處理,也可填中文譯名,若分類已明確表明用途亦留空處理。
    • 應該在幾個字內囊括,不要貼上宣傳標語,而是概述它是做什麼的、有什麼用途。宣傳語是【補充】要做的事。
  • 【補充】補全網站性質、描述,應該摘自官網介紹或譯文、自己總結的簡要介紹。或以目標站點的「關於我」或類似頁面的信息為主。也可用來補全站點未聲明的個人建議、想法、評價。
  • 若名稱或分類、網站知名度足以有較高辨識度,可以不填寫任何說明。

 

標識規則

注意,由于精力问题,现有收录内容除涉及盈利性质(如使用网赚网盘等)并未严格赋予标识,您可以反馈或给出自己的建议,我审查后进行标注。

注意,均含有強烈的主觀情感,由我個人喜好判斷,而不代表質量。比如scio系列站點也被授予了【顶】標識

正面標識:

  • 【神】:一些無法言喻的站點,他們的存在就是人類撿到寶了。特點必須是包括但不限於 涉獵範圍廣、內容質量高、研究方向新穎有趣有價值(如果有重複資源,則僅順序第一位網站標註標識)。
  • 【顶】:因為某種原因不算做神級站點,但是超級出色,即授予此標識。
  • 【实】:實用向的站點,注意,實用指的並非工具類,工具類大同小異基本不會授予標識,而是特定領域具有很高的參考價值,通常只有在切實幫助我數次的站點才會授予此標識。
  • 【个】:個人的博客或者項目,內容質量非常優秀和突出即授予此標識。此為特殊標識,僅限個人博客/項目/站點使用,此類站點也只能使用此標識。

不授予任何標識的場景:

  • 諸如維基百科、reddit、IA等知名度高的站點不授予任何標識,否則滿屏的標識,影響閱讀,本末倒置。
  • 所屬分類或名稱已經完整表達其用途和性質的工具類站點(原則上也不給工具類站點授予標識)。
  • 如果一個站點是 封閉/半封閉 性質的(包括但不限於惡劣手段導致的資源壟斷、註冊限定),無論其多麼優秀,都不會予以標識。

不授予【神】標識的場景:

  • 單獨拿出來看確實優秀但在同類站點中算不上格外突出的(每個細分類別最多只允許存在一個【神】級標識)。
  • 所以如果一個(細分後的)類別中存在複數個優秀站點,則兩個站點都不會授予此標識。

負面標識:

  • 【$】:不一定是直接收錢,各種強制註冊、積分下載制度的站點(不包括正版平台)。
  • 【水】:內容很空泛,質量對不起噱頭,但是因為一些原因還是收錄了。
    • 由於一些原因(比如同類站點暫時匱乏、雖然各種麻煩,但是還沒有找到、着手找良好的替代品),這些站點暫時被收錄,但是項目初步完善後就要整治這些站點。
  • 【慎】:比如站點用的「網賺網盤」託管的資源,或者其他第三方服務,有一定風險的,會加上此標識並說明原因。
    • 鑑於實操的便捷性,我都安裝了一些阻止廣告、網賺短鏈的的拓展,部分站點聲明了廣告短鏈但部分沒有聲明,就是因為一開始的時候是關掉拓展測試的,後來覺得太不現實,畢竟此類插件幾乎是必備的,誰想給予金錢外的支持可自行添加白名單,所以後續一直開着此類拓展測試,畢竟針對的大都是資源類站點,對於此類站點,下載方式才是最重要的,因此關於可被屏蔽的廣告的標註或不準確。

特殊標識:

标识区域標識

  • {xxx}:該 站點 為某個已收錄站點的子站、子項目時進行標註,不算重複站點。
    • 在「文章」或類似類別、場景下,需無視此規則。
  • [xxx]:語言標識,當站點【網站標題】使用語言與實際頁面語言不同時進行標註(通常用於多語言頁面的標註)。
  • 【待备】/【已备】:一些給不了上述正面標識但是我非常想將其備份下來的優秀站點,也是日後鏡像站點的主要目標。(多出現於同類站點中有複數個優秀站點的情況,算是一個補償機制)

其他區域標識

  • *:標註在【網站標題】末,意指此站點為重複站點,一般是因類別原因重複,按照命名規則居後者添加此標識,適用於重複量少的時候。
  • #xxx:在【網站標題】末,用來標註站點存活相關狀態,比如「PS-Survival #重建中」,因為一些站點曾受益頗深,關閉中/恢復中的站點也會酌情留存一段時間,所以加以此標識註明。
  • <注释>:在該行/段落/部分的首或末端標註,表示這是一段註釋,可以根據需要填寫任意內容,主要是補充聲明的用途。
  • [discord]:在【補充】任意位置,用來標註是否有discord社區群組,但是本計劃起步於臨近定稿之時,大量內容未標註。

所有出現的特殊標識均不得在非標識場景外使用,比如「」、「{」、「[」……。只能在規定的場合、場景使用,以便於後續的批量操作、整理。

 

數據處理細則

收錄標準

  基本底線是非營銷目的的網站、具有實質內容的站點。

  現收錄一般經過兩道基礎審查手續:收錄時的審查(納入瀏覽器書籤欄待辦)、規範化時的審查(納入.md工作文件);兩道特殊審查手續:調整分類/優化描述/偶爾抽查時的再度訪問、受反饋後的重新排查。審查標準則全憑個人喜好。

  本項目並不傾向於收錄個人博客,因為眾所周知的原因,個人博客的同質化嚴重,同質化較弱的生活類博客與本項目關聯也弱,而技術類博客多為it類博客,其中尤以高度重疊的普通指南(及隨便一搜成百上千一樣內容)為主,即便具有深度實際有需求時仍需藉助搜尋引擎而不是逐個站內搜索,而本項目的初衷絲毫不包括鼓勵個人博主創作,故對於個人博客或可參考建站/碎碎念#webrings所列博客聯盟,後續博客類除歷史遺留因素、題材及體/質量因素外,或將歸於新頒子項目b.txt文檔內。(但有計劃做搜尋引擎,內容以個人博客及一些優質社區為主,但考慮到需要的技術力和伺服器性能並未打算開始)

站點排序

  通常情況下,在我主觀判斷下質量較好的站點會向前排列,但是質量相仿的會按照字母升序排列或收錄時間排序。

  但質量並不是一個很好的參考標準,比如一些個人博客,涉及的類別不同根本無法對比,也不適合進行對比,我亦沒有能力對比,所以那些站點的排列順序就沒有排名一說,但目前並未有哪些標識用於告知人們這條信息。

  因此OSINT項目沒有傳統的質量分級,我奉行的是分組和收錄時間以及個人傾向(但我長久/實質的需求很少,這個存在感很弱)和首字母排序。其中分組是看的類別、題材、話題、體量、社區討論度綜合而行,而不是人們通常下意識認為的帶有偏見的「質量」。

描述及用詞

  我不想做一個站點評論員,「篩選」這一步驟在其被收錄時就已經執行了,「排名/權重」也以個人喜好度及題材體現在其所在位置上,故基本原則是沿用站點方描述。

  但這樣會有一些問題,諸如書籍資源網站數量的統計,基本源於官方站點的描述,或者匯總頁面的粗略估計,但站點常有虛報、重複計算,甚至是一篇文章算一本書 等不應做參考的數據存在,因此,所有的描述請只做參考而非事實。

  除此之外,諸如「遠程查看」(remoteviewing)、「摺疊」(collapse),這種主流互聯網譯為「遙視」、「崩潰」的,因為歷史因素——這種國內萎靡甚至是沒有討論的內容我都是以谷歌對頁面的翻譯為主,先入為主後,儘管後來產生/得知其他更貼切或流行的稱謂,也因為自己並不實際與人交流而未有改變措辭的契機——便按照我個人喜好來了。

網站放置位置

  由於項目跨度問題,分類無法做到全面照顧,也不願意太多重複內容,因此對於某網站符合多個分類的定義但網站並未矚目到使我重複收錄時,具體放置位置就較為模糊了,基礎的原則是優先歸於具傾向性的、更高層級的、同類更多的。

  比如「某OBE社區」同時符合「三級目錄-02Z-重超自然」、「二級目錄-06Y-OBE/出體」,但其即為社區,前者所屬的二級目錄(二級目錄-01Y-/X/討論)又比後者更靠前,故放置於前者分類下。

  比如,圖書庫、百科的性質歸類於高排名且同題材/性質站點更多的【書庫】和【百科】專區/分類。