opencvでスキャン後の余白カット

ImageMagickの-trimオプションでもいいかなあと思っていたんだけど、斜めにスキャンした画像の補正とか-fuzzの調整とか色々面倒。

と思いつつImageMagickを使ったりGIMPの台形補正(遠近法)ツールでシコシコやったりしてごまかしていたけど、どうやらopencvを使うとわりと簡単にできそうなのでやってみた。

最近は便利そうなライブラリはみんなPythonバインディングなのね。Perlがほしい。

「四角」「矩形検出」「python」「opencv」みたいなワードで検索するとたくさん情報やサンプルコードが出てくるので参考になります。

導入

チュートリアルのページなどを見つつ必要なモジュールをインストールする。

昔は違ったらしいけど、今はpipで簡単にインストールできる。

$ python -m pip install cv2
$ python -m pip install numpy
$ python -m pip install matplotlib

Pythonopencvは内部の数値計算にnumpyを使っていて、内部データがnumpyになっている。

numpyの使い方を覚えておくともっと効率よくプログラミングできそう。

matplotlibは特に必須ではないけど、画像やグラフを表示するときに使う。

あとチュートリアルのページに出てくるのでサンプルコードを動かすためにも入れておいたほうがよい。

コード

検索してみると、だいたいの流れは

  1. 画像の2値化
  2. 輪郭検出
  3. 台形補正

という感じ。

輪郭検出に使う画像が2値化画像なので、前もって画像を2値化しておく必要がある。

このやり方によって輪郭検出の精度がだいぶ変わってくるので、ここの調節が重要。

輪郭検出で四角形が検出できたら、その4頂点を使って台形補正を行えば余白削除&斜行補正のされた画像が得られる。

import sys
import numpy as np
import cv2
from matplotlib import pyplot as plt

def find_contours(img):
    image, contours, hierarchy = cv2.findContours(img, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)
    areas = []
    for cnt in contours:
        area = cv2.contourArea(cnt)
        if area > img.size*0.5 and area < img.size*0.95:
            epsilon = 0.1*cv2.arcLength(cnt, True)
            approx = cv2.approxPolyDP(cnt, epsilon, True)
            if len(approx) >= 4:
                areas.append(approx)

    img_c = cv2.drawContours(cv2.cvtColor(img, cv2.COLOR_GRAY2BGR), areas, -1, (0,0,255), 3)
    return img_c, areas

img = cv2.imread(sys.argv[1])
print("shape : " + str(img.shape))
print("size  : " + str(img.size))
print("dtype : " + str(img.dtype))

# statistics of margin
# H: 180*0.658 = 118.44, sigma=3.6
# S: 255*0.164 = 41.82, sigma=7.9
# V: 255*0.192 = 48.96, sigma=9.43

img_org = img
img     = cv2.GaussianBlur(img, (5, 5), 0)
img_hsv = cv2.cvtColor(img, cv2.COLOR_BGR2HSV)
for n in range(30, 120, 5):
    mask_margin = cv2.inRange(img_hsv, (100,0,0), (120,0+n,0+n))
    r, area_margin = find_contours(mask_margin)
    print("find_contours :", n, "->", len(area_margin), "found")
    if area_margin:
        break

if not area_margin:
    print ("error: no contours found")
    sys.exit(0)

## sort contours topleft,topright,bottomleft,bottomright

area = area_margin[0]
area = sorted(area, key = lambda x: (x[0][0]+x[0][1]))  # x+y (x^2+y^2 is better?)
if area[1][0][0] < area[2][0][0]:
    tmp = area[1];
    area[1] = area[2]
    area[2] = tmp

print("contour:", area)

# 出力座標の計算(三平方の定理)

l_top = area[0][0]
r_top = area[1][0]
l_btm = area[2][0]
r_btm = area[3][0]

top_line   = (abs(r_top[0] - l_top[0]) ^ 2) + (abs(r_top[1] - l_top[1]) ^ 2)
btm_line   = (abs(r_btm[0] - l_btm[0]) ^ 2) + (abs(r_btm[1] - l_btm[1]) ^ 2)
left_line  = (abs(l_top[0] - l_btm[0]) ^ 2) + (abs(l_top[1] - l_btm[1]) ^ 2)
right_line = (abs(r_top[0] - r_btm[0]) ^ 2) + (abs(r_top[1] - r_btm[1]) ^ 2)
max_x = top_line  if top_line  > btm_line   else btm_line
max_y = left_line if left_line > right_line else right_line

print("width={}, height={}".format(max_x, max_y))

# 画像の座標上から4角を切り出す
pts1 = np.float32(area)
pts2 = np.float32([[0, 0], [max_x, 0], [0, max_y], [max_x, max_y]])

# 透視変換の行列を求める
M = cv2.getPerspectiveTransform(pts1, pts2)

# 変換行列を用いて画像の透視変換
img_cropped = cv2.warpPerspective(img_org, M, (max_x, max_y))

plt.subplot(1,3,1),plt.imshow(cv2.cvtColor(img_org, cv2.COLOR_BGR2RGB),'gray'),plt.title('ORIGINAL')
plt.subplot(1,3,2),plt.imshow(cv2.cvtColor(r, cv2.COLOR_BGR2RGB),'gray'),plt.title('mask')
plt.subplot(1,3,3),plt.imshow(cv2.cvtColor(img_cropped, cv2.COLOR_BGR2RGB),'gray'),plt.title('cropped')
plt.show()

結果


斜めにスキャンされた画像もキレイに余白が削除されてますね。

細かい話

解説というかメモ。

ガウシアンぼかし
img     = cv2.GaussianBlur(img, (5, 5), 0)

最初にガウシアンぼかしをかけて色を滑らかにしておくと後の処理がしやすい。
(5, 5)はカーネルサイズ。でかい画像はカーネルサイズを大きくするなど調節が必要そう。

2値化画像
def find_contours(img):
    image, contours, hierarchy = cv2.findContours(img, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)
    areas = []
    for cnt in contours:
        area = cv2.contourArea(cnt)
        if area > img.size*0.5 and area < img.size*0.95:
            epsilon = 0.1*cv2.arcLength(cnt, True)
            approx = cv2.approxPolyDP(cnt, epsilon, True)
            if len(approx) >= 4:
                areas.append(approx)

    img_c = cv2.drawContours(cv2.cvtColor(img, cv2.COLOR_GRAY2BGR), areas, -1, (0,0,255), 3)
    return img_c, areas

img_hsv = cv2.cvtColor(img, cv2.COLOR_BGR2HSV)
for n in range(30, 120, 5):
    mask_margin = cv2.inRange(img_hsv, (100,0,0), (120,0+n,0+n))
    r, area_margin = find_contours(mask_margin)
    print("find_contours :", n, "->", len(area_margin), "found")
    if area_margin:
        break

多くのサイトではcv2.thresholdで画像を2値化する方法を紹介しているけど、今回の画像では今ひとつ上手くいかない。

普通に2値化しただけだと全く検出できない。

2値化のチューニング案としては、例えば色々な色空間のチャネルごとに輪郭検出をしてマスク画像を合成するというのがある。

確かに精度は良くはなったけど、名刺やポストイットみたいな単色の抽出ならともかく雑誌のページみたいな複雑な画像は難しいみたい。

上手くチャネル分解するとか、ガウシアンぼかしのチューニングをするとか、色々調整が必要っぽい。

面倒になったので、今回の目的に特化して「スキャナーの余白を削除する」を素直に実装することにした。

OpenCVのinRange()関数で画像が特定の色範囲に含まれているかどうかチェックできる。

この結果を2値画像として輪郭検出処理にかけることにする。

またRGB(OpenCVはBGRだけど)よりHSVの方が色検出に向いてるようなので、HSVに変換してからinRange()で余白を抽出する。

GIMPで余白部分の情報を取得して、パラメーターの参考にする。

# statistics of margin
# H: 180*0.658 = 118.44, sigma=3.6
# S: 255*0.164 = 41.82, sigma=7.9
# V: 255*0.192 = 48.96, sigma=9.43

なるほど。(100,0,0), (120,50,50) くらいにすれば良さそう。

この値も検出精度に関わるので、下限から少しずつ上げていって輪郭検出ができた時点で止めるというロジックにした。

色々試した結果、今回のデータだと大体S,V = 60くらいで検出できるようになる。

findContours()で輪郭の検出、approxPolyDP()で輪郭の多角形近似ができる。

検出した輪郭のうち、小さすぎたり大きすぎたり(画像全体を輪郭として抽出することがある)するものを除いて、近似後の頂点が4のものを四角形として保存する。

approxPolyDPのパラメーターはコピペ。。

領域(輪郭)の特徴 — OpenCV-Python Tutorials 1 documentation

epsilon = 0.1*cv2.arcLength(cnt,True)
approx = cv2.approxPolyDP(cnt,epsilon,True)
頂点のソート
area = area_margin[0]
area = sorted(area, key = lambda x: (x[0][0]+x[0][1]))  # x+y (x^2+y^2 is better?)
if area[1][0][0] < area[2][0][0]:
    area[1], area[2] = area[2], area[1]

切り取った画像のサイズ計算から射影変換の流れは以下のページをそのまま参考にした(コピペともいう)のだけど、そのまま使うと画像が回転したり反転したりする。

OpenCVで台形補正がしたかった話。応用編。

ので、あらかじめ頂点をソートする。numpyの関数でもっとスマートにできるのかもしれない。

  1. 原点からの距離が近いものが左上、遠いものが右下
  2. 残り2つはxの値が大きい方が右上、小さい方が左下

という感じで、左上、右上、左下、右下という順番に並び替える。

ところでPythonって変数のスワップをtmpみたいな一時変数なしに直接書いてOKなんですね。地味に便利。最近のLLは大体そうかな?

追記



見にくいけど、[130 55 55]のところで余白削除が不完全になってて台形でトリミングされてしまっている。

ので、領域が直角かどうかのチェックを加えることにした。

あと、あまり下の方からチェックしていくと変なのが検知されるので、もう少し大きな値からスタートすることにした。

何にしてもトリミングした後の目視確認は必要ですね・・・。

def angle(p1, p2, p3):
    p12 = p1[0] - p2[0]
    p23 = p3[0] - p2[0]

    dot = np.dot(p12, p23)
    norm_12 = np.linalg.norm(p12)
    norm_23 = np.linalg.norm(p23)
    cos = dot / (norm_12 * norm_23)
    rad = np.arccos(cos)
    theta = rad * 180 / np.pi
    return theta

def vars_from_rightangle(quad):
    # 01
    # 23
    r1 = angle(quad[0], quad[1], quad[3])
    r2 = angle(quad[1], quad[3], quad[2])
    r3 = angle(quad[3], quad[2], quad[0])
    r4 = angle(quad[2], quad[0], quad[1])
    var = 0
    for r in (r1, r2, r3, r4):
        var = var + pow((90-r), 2)
    print("r1={}, r2={}, r3={}, r4={}, var={}".format(r1, r2, r3, r4, var))
    return var
find_contours : [100   0   0] [130  50  50] -> 0 found
find_contours : [100   0   0] [130  55  55] -> 1 found
r1=92.19912728111747, r2=88.25982795073007, r3=89.18250765828346, r4=90.35853710986905, var=8.661202147533869
find_contours : [100   0   0] [130  60  60] -> 1 found
r1=89.5558975296218, r2=90.29483478368576, r3=89.81778811349452, r4=90.33147957319791, var=0.4272344328984021

EvernoteのAPIを使ってみる

Documentation - Evernote Developers

Perlでいいかなぁと思ったけど公式ドキュメントが不親切なのでPythonにする。

Evernote Cloud API — Python Quick-start Guide - Evernote Developers

getting startedのドキュメントによると、まずは

  1. sendboxのアカウントを取得する
  2. Evernote API keyの申請をする

次にSDKをインストールする。

$ pip install evernote

を実行するとエラーになる・・・

GitHub - evernote/evernote-sdk-python: Evernote SDK for Python
GitHub - evernote/evernote-sdk-python3: Testing the Evernote Cloud API for Python 3

This is a test SDK! The official Evernote SDK for Python doesn't support Python 3 yet; this repository is an experiment as we try to migrate.

えぇ・・・。

今の時代はPython3だと聞いたのでPython2とか入れてないんだけど。

http://dogwood.skr.jp/blog/2013/12/426/

なるほどね〜

というわけでCygwinPythonをアンインストールしてWindows版にする。

$ py -2 -m pip install evernote

うまくいった。

一通り環境はできたのでサンプルコードを書きたい。が、その前にアクセストークンを取得しておく。

Developer Tokens - Evernote Developers

sandboxのdeveloper tokenはすぐに取得できるけど、productionのdeveloper tokenは "Update: the creation of developer tokens is temporarily disabled." などというメッセージが出て取得できないようになってる。

仕方がないのでsupportのページからAPI keyのactivation申請をする

Support - Evernote Developers

に行くと"Activate an API Key"というボタンがあるので適当に入力する。

How do I copy my API key from Sandbox to www (production)?


This process is called key activation. To activate your API key on Evernote’s production servers, file a key activation request using this form. Once we’ve determined that your integration fulfills all of the requirements of a production application, your key will be activated within 1?2 business days. You’ll be notified when your key has been activated (or if there’s an issue with your application that needs to be addressed).

申請項目のpermissionというのがよく分からんかったけど、多分ここのページに乗ってる意味でのpermissionなんだと思う。

API Key Permissions - Evernote Developers

とりあえず "Full access" permissionを下さいな、と書いておいた。

サンプルコード

ノートブックとノートブック内のノートのリストを表示する。

from evernote.api.client import EvernoteClient
from evernote.edam.notestore.ttypes import NoteFilter, NotesMetadataResultSpec

dev_token = "<your developer token>"
client = EvernoteClient(token=dev_token)

userStore = client.get_user_store()
user = userStore.getUser()
print "username : " + user.username + "\n"

offset = 0
max_notes = 10

noteStore = client.get_note_store()
notebooks = noteStore.listNotebooks()

for n in notebooks:
	print "* " + n.name
	filter = NoteFilter(notebookGuid=n.guid)
	result_spec = NotesMetadataResultSpec(includeTitle=True)
	result_list = noteStore.findNotesMetadata(dev_token, filter, offset, max_notes, result_spec)
	for note in result_list.notes:
		print "\t- %s" % note.title
$ py -2 a.py
username : kobayashi01234

* <Inbox>
* プロジェクトその1
* testbook1
        - testnote001

なるほどね。

シンプルにノートブック名を指定してノート一覧を取得できればいいのだけど、そういう機能はないっぽい。

Get a notebook by name and its notes - Evernote API Discussion - Evernote User Forum

追記

API keyのactivation mailが6/3朝(USだとすると現地時間では6/2夕方)くらいに来ていた。結構すぐに来るものなんだな。そして適当に申請してもだいじょうぶそうw

CygwinでHTTPS接続できないときはca-certificatesをチェックしよう

何度かブログで触れている気がするdropbox-apiスクリプト

https://github.com/s-aska/dropbox-api-command

いつの頃からか(今思えばCygwinパッケージをアップグレードした辺りからか・・・)エラーになった。

$ dropbox-api ls /sync
2018-05-28T16:51:48 [WebService::Dropbox] [ERROR] https://api.dropboxapi.com/2/files/list_folder {"path":"/sync"} -> [500] Can't connect to api.dropboxapi.com:443

なんやねん、dropboxが落ちてるのかAPIが終了になったのか・・・と思ってcurlでチェックしてみるとAPIは問題なく動作してるっぽい。

$ curl -k -X POST https://api.dropboxapi.com/2/files/list_folder \
>     --header "Authorization: Bearer $ACCESS_TOKEN" \
>     --header "Content-Type: application/json" \
>     --data "{\"path\": \"/sync\"}"

ちなみに-kをつけないとcertificateのエラーが出る(これも伏線)。

curl: (77) error setting certificate verify locations:
  CAfile: /etc/pki/tls/certs/ca-bundle.crt
  CApath: none

小一時間悩んで、そもそもPerlHTTPSアクセスができないのでは・・・と思って簡単なスクリプトでチェックしてみたらビンゴっぽい。

use strict;
use warnings;
use LWP::UserAgent;
use HTTP::Request;

my $ua = LWP::UserAgent->new;
my $req = HTTP::Request->new( GET => 'https://www.flickr.com/');
my $response = $ua->request($req);

### $response
### $response: bless( {
###                     _content => 'Can\'t connect to www.flickr.com:443',
..
###                     _msg => 'Can\'t connect to www.flickr.com:443',
###                     _rc => 500,

PerlというかLWPでHTTPSのコンテンツが取得できない、ってわりと良くある割に分かりにくい問題で、一昔前ならNet::SSLeayをインストールしましょうみたいなのがテンプレだったのだけど。

PerlでSSL(https)のサイトのコンテンツが取得できない - ノウハウブログ - カンタローCGI

一通り必要そうなモジュールをチェックしてみたけど導入済みだし、何やろうなあ。

"perl https 500 error"で検索したら最初に出てくるサイト。

perl - 500 error with LWP:UserAgent - Stack Overflow

"verify_hostname=0" ねえ・・・そういや上のcurlでも証明書のエラーが出てたな、と思って試してみたら動くではないか。

というわけで、当初の問題は環境変数 PERL_LWP_SSL_VERIFY_HOSTNAME=0 を指定すれば解決。

$ PERL_LWP_SSL_VERIFY_HOSTNAME=0 dropbox-api ls /sync

・・・解決はするけど、毎度毎度証明書を無視するオプションを付けるのは面倒だしセキュリティ的にもいかがなものかと思うので、もう少し調べる。

と、Cygwinでは ca-certificates パッケージが証明書ファイルを持っているようなので再インストールしてみると環境変数を指定しなくても動くようになった。

よかったよかった。それにしてもHTTPSというかSSLというか証明書周りは面倒くさいなあ・・・。

Wunderlist APIを使ってみた

Wunderlistの完了済みタスクをコピーしてEvernoteに保存してタスクを削除、というのを毎週するようにしたのだけど、どうにも面倒くさい。

Documentation | Wunderlist Developer

APIが提供されているから自動化できそう。

検索するとPerlではAPI::Wunderlistというモジュールが公開されているのだけど、インストールがどうも上手く行かなくて、強制インストールするとコードがエラーになる。

http://deps.cpantesters.org/?module=API%3A%3AWunderlist;perl=latest

どうやらType::Tinyのテストが失敗するようなのだけど、コードが抽象的すぎてよく分からんし諦めた。

そもそもX-Client-IDとX-Access-Tokenを付けたHTTPを投げるだけなんだから、curlを使ったシェルスクリプトでもいいんだよね。PerlならLWPをそのまま使ってもいいし。何でインストールに四苦八苦してまでモジュールを入れんといかんねん。

こういうマイクロな実装ってライブラリの導入とか依存関係とかで困るから結局モノリシックなものが便利なんじゃないかという気になってきた(老化)

余談はともかく。完了したタスク+ノートをリストアップするスクリプトを作ってみた。

LWPでもいいけど、REST::ClientといのがLWPベースのシンプルな実装っぽいので使うことにした。

use strict;
use warnings;
use Carp qw/croak/;

use REST::Client;
use HTTP::Response;
use JSON::XS;
use YAML::Syck;

my $JSON   = JSON::XS->new->utf8;
my $API    = 'a.wunderlist.com/api/v1';
my $client = REST::Client->new();
my $res;

$client->addHeader('X-Client-ID', $CLIENT_ID);
$client->addHeader('X-Access-Token', $ACCESS_TOKEN);

# 1. get lists
$client->GET("$API/lists");
$res = res_with_check($client);
### $res

# 2. get completed tasks and notes
my @ctasks;
foreach my $l (@$res){
  ### $l
  $client->GET(sprintf("$API/tasks?completed=true&list_id=%s", $l->{id}));
  $res = res_with_check($client);
  ### $res
  foreach my $t (@$res){
    ### $t
    $client->GET(sprintf("$API/notes?task_id=%s", $t->{id}));
    $res = res_with_check($client);
    ### $res
    push(@ctasks, {
      id           => $t->{id},
      list         => $l->{title},
      title        => $t->{title},
      created_at   => $t->{created_at},
      completed_at => $t->{completed_at},
      note         => ($$res[0]->{content} || ''),
    });
  }
}
### @ctasks

DumpFile("wl_completed.yml", \@ctasks);

sub res_with_check{
  my $client = shift;
  my $code = $client->responseCode();
  if($code ne '200'){
    my $err = sprintf("Server Error: %s\n", HTTP::Response->new($code)->status_line);
    $err .= $client->responseContent() . "\n" if $client->responseContent();
    croak $err;
  }
  my $data = $client->responseContent();
  my $tree = $JSON->decode($data);
  return $tree;
}
  • ドキュメントによるとnotesにはlist_idも指定できるんだけど、未完了タスクだけで完了済みタスクのnoteを取ってこないから、個別のtaskごとにリクエストしないとダメっぽい
    • そもそもWLのタスクに付けてるメモは "Note" ではなく "Task comment" だと思ってて「なんで空のコンテンツが返ってくるんや〜」って数時間悩んでいた。説明が足りない。Documentation | Wunderlist Developer
  • REST::Client->GETがいい感じにエラーハンドリングしてくれて直接contentを返してくれたらコードがスッキリするかなあ
  • JSONで受け取ったデータをYAMLで保存するのもアレだなあと思うんだけど、見やすいし手動で加工しやすいので
  • REST APIをいい感じに扱えるライブラリってなんだろ。rubyとかpythonの方がいいのかなあ。

追記 2018-11-07

http - Perl: Programatically set POST param using REST::Client module - Stack Overflow

POSTでJSONデータを渡すときは明示的に "Content-type: application/json" を付けないといけないらしい。気づかなくて小一時間悩んでしまった・・・。

あと、JSONのencode/decode周りの日本語処理がクソ訳わからなくて心が折れそうになった。

こんな感じでモジュール化したので、今後使う機会があればもっと簡単にできそう。

sub new{
  my $this  = shift;
  my $class = ref($this) || $this;
  my $self  = {};
  bless $self, $class;

  $self->{api}    = 'a.wunderlist.com/api/v1';
  $self->{client} = REST::Client->new;
  $self->{client}->addHeader('X-Client-ID', $client_id);
  $self->{client}->addHeader('X-Access-Token', $access_token);
  return $self;
}

sub post{
  my $self = shift;
  my ($op, $data) = @_;
  my $uri = sprintf("%s/%s", $self->{api}, $op);
  $self->{client}->POST($uri, JSON::XS->new->ascii->encode($data), {"Content-type" => 'application/json'});
  return $self->res_with_check;
}

10年遅いPerlのourの話

10年ぶりにPerlを書いて色々調べていたら超懐かしい話題を見かけたので。
ourの挙動は分かったけど、一番重要なのはそれで何が嬉しいの?という事じゃないのかなあ。
要するにuse strict環境でグローバル変数(完全修飾名?)を簡単に作れる方法というだけ。

use strict;

package VERY::LONG::NAME::MODULE{
  # $var = 1; これはエラー
  # $VERY::LONG::NAME::MODULE::var = 1; これはOKだけど面倒くさい
  # my $var = 1; スコープを外れると見えなくなる(undef)
  our $var = 1;
}
print "$VERY::LONG::NAME::MODULE::var\n";

Firefox webdriverでcookieが読めなくなった話

取得したクッキーを保存して読み直すだけのコードである。

from selenium import webdriver
import json

driver = webdriver.Firefox()
#driver = webdriver.Chrome()
#driver = webdriver.PhantomJS()

try:
    driver.get("http://www.google.com")

    fw = open('cookies.json','w')
    json.dump(driver.get_cookies(),fw,indent=4)
    fw.close()
    
    f = open("cookies.json")
    cookies = json.load(f)
    f.close()

    for cookie in cookies:
        driver.add_cookie(cookie)

finally:
    driver.quit()

最近Firefoxのバージョンを最新(57)に上げたら、上のコードがエラーになった。

$ python test.py
Traceback (most recent call last):
  File "test.py", line 24, in <module>
    driver.add_cookie(cookie)
  File "/usr/lib/python3.6/site-packages/selenium/webdriver/remote/webdriver.py", line 760, in add_cookie
    self.execute(Command.ADD_COOKIE, {'cookie': cookie_dict})
  File "/usr/lib/python3.6/site-packages/selenium/webdriver/remote/webdriver.py", line 308, in execute
    self.error_handler.check_response(response)
  File "/usr/lib/python3.6/site-packages/selenium/webdriver/remote/errorhandler.py", line 194, in check_response
    raise exception_class(message, screen, stacktrace)
selenium.common.exceptions.WebDriverException: Message: .google.co.jp

よく分からん。

ドメインの先頭にドットがついてるとエラーになる(InvalidCookieDomainException)という話もあるみたいだけど、generalなWebDriverExceptionとしか出てこないので、やっぱりよく分からん。

先頭のドットを消すと確かにExceptionを出さずに動くようになるのだが、そうすると目的のプログラムでcookieを期待通りに読んでくれなくなって詰む。

仕方ないのでChromeを使うか・・・と思うと、今度はswitch_to.windowでactiveにしたウインドウ(タブ)は必ずフォアグラウンドになってしまうというアレな仕様で詰む。(参考:ウインドウの最小化 - XXXannex

Seleniumを使うと、だいたいあちらを立てればこちらが立たぬ・・・みたいなことが多くてウンザリする。

iMacrosを自動起動する方向に変換した方がいいのかもしれない。まあ、あちらはあちらでwindows nativeなことができなくて困りそうだけど。

ま、いいや。とりあえず適当に53(53.0.3)くらいまで戻して事なきを得た。二度とアップグレードしないぞ。

追記

自動更新をOFFにし忘れたせいでまた57にアップグレードされてしまった。切れそう。

○○ソートみたいなやつ

ソートファクトリー
こういうの。

use strict;
use warnings;
use Path::Class;

my @list  = file('list.txt')->slurp(chomp=>1);
my $COUNT = 0;
print "$_\n" foreach sort { compare($a, $b) } @list;

sub compare{
  my($lhs, $rhs) = @_;
  printf("#%02d: which do you like?\n", ++$COUNT);
  print "1. $lhs\n";
  print "2. $rhs\n";
  print "3. Even\n";
  my $input = <>; $input =~ tr/\x0A\x0D//d;
  if($input == 1){
    return -1;
  }
  elsif($input == 2){
    return 1;
  }
  elsif($input == 3){
    return 0;
  }
  else{
    die;
  }
}