README.md 19 KB

これは何?

5ch.netからdatを取得し、クライアントに返すプロクシです。 接続先が*.2ch.netの場合、内部でURLを*.5ch.netに変換した上で接続を行います。

使い方

起動し、各ブラウザのプロクシ設定を変更してください。デフォルトではポート9080で接続を受け付けます。以下のオプションが指定可能です。

  • -p port1[,port2,...]

    待ち受けするポート番号を指定します。デフォルトは9080です。カンマ区切りで複数指定することが可能です。

  • -t timeout

    タイムアウト(秒) を指定します。デフォルトは30秒です。

  • -a user-agent

    proxy2chからリクエストを行う際のUser-Agentヘッダを指定した値で上書きします。指定しない場合はクライアントがヘッダに付与した値がそのまま送信されます。

  • -g

    全ての接続を受け付けます。これを指定しない場合は、同じマシンからlocalhost(127.0.0.1)への接続のみを受け付けます。

  • -c

    HTTP CONNECTリクエストを受け付けます。httpsなプロクシとして動作するようになりますが、このオプション単体ではリクエストの改変は行えないので透過的なプロクシとしてのみ機能します。

  • -4

    強制的にIPv4で接続します。

  • --proxy server:port

    プログラムが使うプロクシサーバを指定します。
    socks4://192.168.1.1:1080のように頭にsocks4://socks5://を付けると、socksプロクシを指定できます。

  • -b backlog

    listen関数で接続を待ち受けるソケットのbacklogの値を指定します。デフォルトは32です。

  • -s

    *.2ch.net, *.5ch.net, *.bbspink.comドメインへの接続をhttpsで行います。

  • --api AppKey:HmacKey

    このオプションを指定すると、5ch/bbspink/talkの読み書きにAPIを利用しますが、5ch/bbspinkは2023年7月10日をもってAPIを利用しないdatの直接取得が復活したため、このオプションを指定する意味があるのはtalkの読み書きをしたい場合のみです。

  • --api-usage read|post|all|postinclpink|allinclpink|talk

    --apiオプションが指定されたときにAPIを使う用途を指定します。talkを指定する場合はtalkの読み書きにAPIを使います。現在はtalk以外の値を指定する意味はありませんが、readを指定すると5chの読み込みのみ、postを指定すると5chの書き込みのみ、allを指定すると5chの読み書き両方にAPIを使います。デフォルト値はallです。postinclpinkあるいはallinclpinkを指定することでbbspinkへの書き込みにもAPIを使うことができます。

  • --api-auth-ua user-agent

  • --api-dat-ua user-agent

    APIのSID取得時、dat取得時のUser-Agentヘッダの値を指定します。

  • --api-auth-xua X-2ch-UA

  • --api-dat-xua X-2ch-UA

    APIのSID取得時、dat取得時のX-2ch-UAヘッダの値を指定します。

  • --api-server server

    APIのゲートウェイサーバを指定します。デフォルト値はapi.5ch.netもしくはapi.talk-platform.comです。

  • --api-override

    APIを使ったdat取得リクエストを受け取った場合、proxy2chがAPIサーバの代わりに取得して返すようになります。MITMが有効になっていなくてもオプション自体は有効ですが、APIリクエストは基本的にhttpsで来るはずなのでMITM前提です。

  • --chunked

    素通しする接続に対して、Transfer-Encoding: chunkedなレスポンスをchunkedなまま送り返します。
    SofTalk WEBというソフトがこのオプションを指定しないと動かないようです。

  • --verbose

    多少詳しくログを表示します。

  • --bbsmenu URL

    URLで指定したアドレスを板リストとみなし、HTMLのリンク中に出現する"5ch.net"の文字列を"2ch.net"に、"https://"を"http://"にそれぞれ置換します。

  • --bbscgi-header "header: value"

    5ch/bbspinkのbbs.cgiに接続要求する際、指定したheaderのリクエストヘッダの値をvalueに上書き (存在しない場合は追加) します。オプションを複数指定することで複数のヘッダを書き換えることができます。 valueの部分に%HOST%もしくは%BOARD%もしくは %THREAD%という文字列が含まれている場合、%HOST%はリクエスト先URLのホスト名に、%BOARD%はリクエストボディから取得した掲示板の名前に、%THREAD%はリクエストボディから取得したスレッドのkeyにそれぞれ置き換えられます。

  • --bbscgi-postorder "field1,field2,..."

    5ch.netのbbs.cgiに接続要求する際、指定した順序にリクエストボディのフィールドを並べ替えます。順序はカンマ区切りでフィールド名を指定してください。指定しなかったフィールドは指定したものの後に続きます。

  • --bbscgi-utf8 none|api|all

    5ch/bbspinkのbbs.cgiにPOSTされるリクエストボディを (Shift JISから) UTF-8に変換するかどうかを指定します。noneを指定すると変換は行われません。apiを指定すると--apiオプションによって書き込みにAPIが使用されるときにのみ変換が行われます。allを指定するとAPIが使用されるかによらず変換が行われます。デフォルト値はapiです。なお、allを指定した場合でもLuaスクリプトでAPI関係のヘッダが追加された場合には (署名が不一致になる可能性があるため) 変換はスキップされます。 変換元のリクエストボディが既にUTF-8になっていると思われる場合はそのまま送信されますが、その場合も含めてContent-Typeヘッダにapplication/x-www-form-urlencoded; charset=UTF-8という値が暗黙のうちにセットされます。

  • --bbscgi-lua path

    5ch/bbspinkのbbs.cgiPOSTリクエストが送られる直前にproxy2chから呼び出されるLuaスクリプトのパスを指定します。
    このスクリプトにwillSendRequestToBbsCgiという関数を定義することにより、proxy2chがbbs.cgiに対して送るリクエストヘッダ/ボディを自由に改変することができます。詳しくはサンプルスクリプトを参照してください。
    --bbscgi-headerオプションと同時に指定した場合、まず--bbscgi-headerオプションによりヘッダの改変が行われ、その後にこのオプションで指定したスクリプトが実行されます。

  • --bbscgi-confirmation auto|skip|none

    5chに投稿する際に表示される確認画面への対応方法を指定します。autoはブラウザには投稿確認画面が表示されますが、ブラウザからのリクエストに介入してサーバに受理される正しいフォームを送るように修正を行います。skipはブラウザには投稿確認画面は表示されなくなり、proxy2chが確認処理を代行します。noneは全てをブラウザ側に任せてproxy2chは何も行いません。デフォルトはautoです。

  • --bbscgi-fix-timestamp

    5ch/bbspinkのbbs.cgiにPOSTする前にtimeフィールドの値を現在時刻の10秒前に修正します。

  • --manage-bbscgi-cookies

    5ch/bbspinkへの投稿に関係するクッキーをproxy2ch側で管理/処理します。有効時はブラウザ側にSet-Cookieヘッダは透過的に送られますが、ブラウザ側からのCookieヘッダはBeやUplift関係のものを除いて無視されます。 --keystoreオプションで指定したファイルがクッキーの永続的な保管庫として利用されます。指定しなかった場合はproxy2chを終了した時点で全てのクッキーは破棄されます。 curlのcookie engineを利用しているためlibcurlが7.77.0未満の場合は利用できません。

  • --gikofix

    ギコナビで5ch.netに書き込めない問題を解消します。bbs.cgiにPOSTする際のbody末尾の余計な改行を取り除きます。

  • --mitm minimal|all

    -cオプションと同時に指定することでいわゆるMITM proxyとして動作するようになります。--mitm minimalとすると5ch.netやbbspink.com等proxy2chが介入する可能性のあるドメインへの接続のみMITMを行い、--mitm allとすると全てのHTTP CONNECTで受け取った接続に対してMITMを行います。

  • --mitm-ca-cert path

    MITMモードでサーバ証明書の署名に使うPEM形式の(自己署名)認証局証明書を指定します。

  • --mitm-ca-key path

    MITMモードでサーバ証明書の署名に使うPEM形式でパスフレーズなしの秘密鍵を指定します。

  • --mitm-certgen

    --mitm-ca-cert--mitm-ca-keyで使える自己署名CA証明書 (有効期限3年) と秘密鍵を生成してPEM形式で標準出力に出力して終了します。

  • --num-threads #threads

    スレッドプール内で待機させるスレッド数を指定します。デフォルト値は8です。

  • --keystore path

    --manage-bbscgi-cookiesオプションを指定したときのクッキーと、APIを使った書き込み時に払い出されたMonaKeyを保存するJSONファイルのパスを指定します。このオプションを指定するとクッキーやMonaKeyが更新された時にパスのファイルが作成・更新され、proxy2ch起動時にファイルから復元されるようになります。

  • --no-direct-dat

    dat取得リクエストを受け取った時、read.cgiの出力を加工して返します。このオプションを指定しない場合は/板名/dat/***.dat (現行ログ) あるいは/板名/oyster/***/***.dat (過去ログ) にあるファイルを直接取得して返します。

  • --subject-to-lastmodify [host1,host2,...]

    5ch/bbspinkのsubject.txtを取得するリクエストを受け取った時、指定したホストについてlastmodify.txtから生成して返します。ホストを指定しない場合は全てのホストが対象になります。

MacのBathyScapheやThousandのように、システムのプロクシ設定を利用し独自のプロクシ設定が不可能な場合は、付属のproxy.pacのようなプロクシ設定ファイルを使うと良いかと思います。 最近のOSX(10.10だけ?)では、同じドメインのサーバに対して既にキープアライブ状態の接続があるとプロクシ経由での接続を行ってくれないらしく、そのような場合はproxy_yosemite.pacのようにプロクシ経由にするアドレスを増やしてみるといいかもしれません (究極的には全ての2ch.net/bbspink.com向けの接続をプロクシ経由にすれば解決するはず)。

なおOSX 10.11.5以降では、安全性のためにpacファイルに完全な(ドメイン名以降のファイルパスを含む)URLが渡されない仕様になったらしく、urlのマッチングを使用したpacファイルは機能しません。proxy_10.11.5.pacのように2ch.net/bbspink全体を対象にするか、各ブラウザが独自にプロクシ設定に対応することを期待する以外ないようです。

注意

--no-direct-dat指定時にread.cgi経由で生成されるdatは、主に半角スペースの個数を厳密に再現できないために直接取得するdatと細部が異なります。そのため、一度取得したことのあるスレッドに対してread.cgi経由と直接取得を切り替えて差分取得を行う場合、不整合が起こる可能性があります。この場合、一度ログを削除して再取得を試みてください。

-sオプションを指定した場合、使用するlibcurlがTLS/SSL対応でビルドされている必要があります。libcurlがバージョン1.1.0未満のOpenSSLもしくはバージョン2.9未満のLibreSSLを使う場合、スレッドセーフを保証するためにロック処理を行う関数を明示的に設定する必要がありますが、proxy2chはこれを行いません。これが原因でクラッシュが発生する可能性があるので、該当するバージョンのOpenSSL/LibreSSLをどうしても使わなければならない場合はこれを参考にロック処理を実装してください。

Luaについて

--bbscgi-luaオプションを使うためにはLua (LuaJITも可) のヘッダ類を用意した上でUSE_LUAマクロを定義してビルドし、libluaにリンクする必要があります。このオプションを使わないのであればLuaは不要です。

MITMモードについて

今の所実験的な機能です。-cオプションでhttpsプロクシを有効にした上でMITMモードを有効にするとhttpsなリクエストに介入することが可能になります。有効にするにはビルド時にUSE_MITMマクロを定義する必要があります。WindowsやMacにおいてもビルドにはOpenSSL (LibreSSL含む) あるいはGnuTLSのヘッダ・ライブラリ類が必要です。USE_GNUTLSマクロが定義されている場合はOpenSSLの代わりにGnuTLSがバックエンドとして使用されます。

OpenSSLを使う場合は1.1.1以降のバージョンを推奨します。3.0以降ではデフォルトではSHA-1を使う暗号スイートが低セキュリティとみなされており、JaneStyle等の古いOpenSSLに依存したアプリとのハンドシェイクが成立しません。そのため、セキュリティレベルを下げることで互換性の改善を行っています。この措置が不要な場合はOPENSSL_NO_SECURITY_DOWNGRADEマクロを定義してビルドを行ってください。

USE_ECDSA_KEYマクロを定義してビルドすると署名にRSA (2048bit) ではなくECDSA (P-256) を使うようになります。サーバ側の処理がRSAに比べて高速 (OpenSSLでのベンチマークでは数十倍の差) なので、貧弱なマシンで動作させる場合はCPU負荷が有意に小さくなる可能性があります。ただし、クライアントが古いOSで動作している場合は対応していない可能性があります。OSレベルでの対応状況はWindowsはVista以降、MacOSは10.6以降、iOSは4以降、Androidは4以降で対応のようです。

--manage-bbscgi-cookiesを指定したときのwebインターフェイスについて

--manage-bbscgi-cookiesを指定した場合、webブラウザからhttp://localhost:9080/5ch/cookiesにアクセスすることでproxy2chの管理下にあるクッキーの閲覧と削除が可能です。また、http://localhost:9080/5ch/accountsにアクセスすることでどんぐりシステム/be/UPLIFTアカウントのログインが可能です。一度ログインすると約12時間後を目安に再ログインします。

ログイン/ログアウトをスクリプト等で自動化したい場合、http://localhost:9080/5ch/accountsに対して以下のパラメータをapplication/x-www-form-urlencoded形式でPOSTしてください。

  • service : donguri, be, uplift のいずれか
  • action : login, logout のいずれか
  • mail : メールアドレス (actionlogoutの場合は不要)
  • pass : パスワード (actionlogoutの場合は不要)

curlでログインする場合は例えばcurl -d "service=donguri" -d "action=login" --data-urlencode "mail=foo@example.com" --data-urlencode "pass=my-secret-password" http://localhost:9080/5ch/accountsとします。

localhost:9080のポート番号の部分はデフォルトの9080番で待ち受けている場合の話です。-pで変更している場合は適宜読み替えてください。なお、 -gを付けて外部からの接続を受け付けている場合でもlocalhost以外からのアクセスは不可です。

bbsmenu生成機能について

proxy2chを起動した状態でhttp://localhost:9080/5ch/bbsmenu.htmlあるいはhttp://localhost:9080/5ch/bbsmenu.jsonにアクセスするとbbsmenu (板一覧) の取得が可能です。そのままだとmenu.5ch.netのものと同等ですが、以下のクエリパラメータを指定することができます。

  • 2ch=true : リンク先のホストを5ch.netではなく2ch.netにします。
  • https=true : リンクのスキームをhttpではなくhttpsにします。
  • talk=true : talkの板へのリンクを含めます。

例えばhttp://localhost:9080/5ch/bbsmenu.html?2ch=true&talk=trueなどとします。proxy2chはtalkを2ch互換掲示板として閲覧可能にする機能を含んでいるため、板一覧に含めることでブラウザからtalkの板をそのまま開くことができるようになります。ただし、書き込みには有効なAPIキーが必要です。

localhost:9080のポート番号の部分はデフォルトの9080番で待ち受けている場合の話です。-pで変更している場合は適宜読み替えてください。なお、 -gを付けて外部からの接続を受け付けている場合でもlocalhost以外からのアクセスは不可です。

コンパイル方法

MacとLinux等Un*xでは、Makefileを使います。 Windows (MinGW/MSYS) の場合、Makefile.mingwを使います。

Macの場合、たぶんそのままコンパイルできるはずです。
その他Un*x系の場合、libcurlとlibiconv、libcrypto(OpenSSL)もしくはGnuTLSが入っていなければ入れましょう。libcurlがSSL/TLS非対応だとAPIに接続できないので注意してください。 Windowsの場合、MinGW/MSYSだけではライブラリが不足しており、コンパイラが認識するよう各ライブラリ/ヘッダ類を適切にインストールする必要があります。以下にMinGWを用いてWin32向けのバイナリを生成する際に必要なファイルの入手先の例を示します。

  • libcurl
  • pthread (MinGWに含まれていない場合)
  • regex (MinGWに含まれていない場合)
  • Lua (--bbscgi-luaオプションを使いたい場合のみ)
  • OpenSSL (MITMモードを使いたい場合のみ)