バコラー日記

人生は決して受け身になってはいけない。攻めるが勝ち!

    タグ:電子書籍化

    • カテゴリ:
      このエントリーをはてなブックマークに追加 Share on Tumblr Clip to Evernote
    本日、Amazonで販売されている裁断済み書籍を検索できるサービス「自炊戦隊サイダーン」をリリースしました。

    自炊戦隊サイダーン | 裁断本を一括検索 はてなブックマーク - 自炊戦隊サイダーン | 裁断本を一括検索 http://www.saidaan.com/

    saidaan560x178

    ちなみに、個人で作った初めてのWebサービスです。


    どうやって作ったの?


    今回、作ったウェブサービスは「Python + web.py + dotcloud」で実装しました。

    プログラミング言語: Python
    フレームワーク: web.py
    サーバー: dotcloud

    技術的に難しいことは全くしておらず、Amazonから書籍情報を取得して「裁断」というキーワードが含まれているかを判別しているだけです。

    詳しくは、また後日、ブログで書こうと思います。


    自炊戦隊サイダーンの使い方


    では、自炊戦隊サイダーンで裁断本を検索する手順をざっと説明していきます。

    (ほぼ、自炊戦隊サイダーンの使い方に書いた内容と同じですが)


    手順1. 「検索」または「ジャンル別」から本を探す


    サイダーンで本を探すには「検索」と「ジャンル別」から探す2通りの方法があります。

    ■ 検索から本を探す


    まず、トップページにて「裁断本をいますぐ検索」の入力フォームに探したい本のキーワードを入れて、「フリーワード検索」のボタンをクリックします。

    キーワードは、書籍名・著者名・出版社・ISBNに対応しています。


    下図の例では「ハルヒ」というキーワードで検索しています。

    how2saidaan_01


    ■ ジャンル別から本を探す


    サイト内の左側にあるサイドバーから本のジャンルを選択してクリックします。

    how2saidaan_07


    手順2. 検索結果一覧 または 書籍一覧から裁断本を探す


    手順1の後、本の一覧が下図のように表示されていると思います。

    一覧から裁断済みの書籍を探すには、本の価格の下に記載してる「裁断本 在庫あり」、「裁断本 売切中」から確認します。

    how2saidaan_02


    書籍が「裁断済み」の状態で販売されている場合、下図のように「裁断本 在庫あり」というメッセージと「amazon.co.jp 詳細ページへ」というボタンが表示されます。

    (※ 在庫切れなどにより、既にAmazonにて販売されていない場合があります。)

    how2saidaan_03


    裁断済み本が販売されていない場合、下図のように「裁断本 売切中」というメッセージが表示されます。

    このとき、「amazon.co.jp 詳細ページへ」というボタンは表示されません。

    how2saidaan_04


    手順3. Amazonで裁断本を買う


    Amazon.co.jpで裁断済み書籍を購入する方法を説明します。

    手順2で「裁断本 在庫あり」の状態である書籍から「amazon.co.jp 詳細ページへ」ボタンをクリックすると、下図のようなAmazonの商品ページが別ウィンドウで開かれます。

    (※ ここからは当サイトではなく「Amazon.co.jp」のページに移動します。)

    Amazonの商品ページを開いた後、裁断済み本が販売されている「中古品」のページに移動します。

    下図の例だと、赤丸で囲まれた「中古品 26点 ¥1より」のリンクをクリックして移動します。

    how2saidaan_05

    中古品のページ(Amazonマーケットプレイス)を開いた後、複数の出品者からの販売情報が表示されます。

    この中から、書籍状態のコメント欄に「裁断済み」「裁断本」などのキーワードが含まれている商品を見つけます。


    下図の例だと、
    出品者:矢後市という方が「【裁断済】ページの抜けはありませんが、表紙以外は裁断済でバラバラの状態… 」
    というようなコメントで裁断本を出品しています。

    最後に、書籍を購入する場合「ショッピングカートに入れる」ボタンをクリックします。

    how2saidaan_06

    サイダーンの使い方の説明はこれで終わりです。

    ちょっとややこしいので、分からなければお気軽にお問合せ下さい。


    謝辞


    今回のWebサービス作成を通して、多くの方々にアドバイスを頂きました。

    みなさま、本当にありがとうございました。

    個人で作った習学のウェブサービスですが、本当に自分一人だけだったら完成できなかったと思います。

    この話も、詳しくはまた後日、改めてブログに書き起こそうと思います。


    次回のサイダーンは?


    今後は、Yahoo!オークションやその他、裁断本販売サイトの書籍を横断検索する機能を実装していく予定です。

    自炊戦隊サイダーン | 裁断本を一括検索 はてなブックマーク - 自炊戦隊サイダーン | 裁断本を一括検索

    要望などありましたら、メールやTwitterとかでお気軽にご連絡下さい。


      このエントリーをはてなブックマークに追加 Share on Tumblr Clip to Evernote
    熊本市内に本の電子書籍化を楽にするスキャン代行サービス「デジタルブック」が登場したようです。

    db

    デジタルブック 本・書籍をPDFにスキャンで電子化

    料金はざっくり以下の通りです。他のスキャン代行サービスと価格設定はほぼ同じ、システムも同じです。
    ■基本サービス
    ・スキャニング作業料100円(税別)/1冊(350ページ以内)

    ■オプションサービス
    ・ファイル名変更 50円/1冊分
    ・OCR(透明テキスト) 100円/1冊分
    ・DVD-R納品 3,000円(送料込・税別)/1回

    ・引用元:料金案内|デジタルブック 本・書籍をPDFにスキャンで電子化

    代金の振込が、ペイパルや楽天銀行ってのが今っぽいですね。

    全国各地にスキャン代行サービスが乱立していますが、熊本在住の方は近場の「デジタルブック」で済ますと納品までの時間も短縮できそうですね。今まで自炊に踏み切れなかった人もこの機会に部屋の本を片付けてみるといいかもしれませんね。

    ちなみに、僕は自炊してます。
    【電子書籍】「Kindle 3」が届きました - バコラー日記
    【電子書籍化】ScanSnap S1300 の設定【自炊】 - バコラー日記


    【PS】
    お願いしたら仕事場見学とかさせてくれないかなぁ。 > 株式会社竹下印刷様

      このエントリーをはてなブックマークに追加 Share on Tumblr Clip to Evernote
    熊本県内の某印刷会社にて本を100冊ほど無料で裁断してもらいました。

    きっかけはGoogleで「熊本市 自炊」のキーワードで検索したところ下記の記事を読んでくださった方がメールして下さったことです。
    【電子書籍化】「ScanSnap S1300」を購入しました【自炊】 - バコラー日記

    昨今の電子書籍化の流れなどをやりとりしていたところ御厚意により手持ちの本を裁断してくださるということで、今日の夜に伺ってきました。印刷会社なので業務用裁断機が置いてあるのですが、コイツが凄いすごい。

    当たり前ですが、自炊の定番である「プラス 断裁機 裁断幅A4 PK-513L 26-106」よりもパワフル。


    せっかくなので、業務用裁断機を使って裁断している様子をデジカメで撮らせてもらいました。



    こりゃぁ綺麗に切れるはずです。


    更に、折角なので社内見学もさせてもらいました。印刷会社の中、思っていた以上に知らないことが多くてとても面白かったです。企業秘密により社内見学の様子は撮影できませんでした。

    この方はかなりの読書愛好家で、ガジェット好きでもあるのでそれから1時間ぐらい美味しいコーヒーを飲みながら立ち話をしました。ケータイも半年に1回買い換えるそうで、いやぁ羨ましいですなぁ。

    あと、自炊代行ビジネスについての話題もありました。印刷会社が自炊代行ビジネスに参入しないのは「薄利多売」で法人営業で取ってきた仕事よりも儲からないからだそうです。でも、熊本県内で自炊代行に参入しようとしている会社もあるとか。まだ噂の段階みたいですが。


    今回のケースはブログをやってて本当によかったなと思える出来事でした。今後、僕のブログの目指すところは色々とありますが、ライブドア社の@941さんのブログにある「行ってきた」シリーズとかは後々、実現していけたらいいなと考えています。
    ・参考:blog::941:行ってきた

    裁断代が1万円近く浮いたので、浮いたお金でまた本でも買おうかな。

    • カテゴリ:
      このエントリーをはてなブックマークに追加 Share on Tumblr Clip to Evernote
    Macで、PDFをページ単位で分割してJPEGに変換する方法を調べたのでまとめます。
    ・参考:PDFをページ単位で分割して、jpegに変換する方法 - release note


    PDFをページ単位で分割


    「joinPDF」というフリーソフトを利用して、PDFをページ毎に分割します。「joinPDF」は下記リンクからダウンロードできます。

    ・DLサイト:joinPDF for Mac - Free software downloads and software reviews - CNET Download.com

    DL後、「JoinPDF2.3.1.sit」をダブルクリックすると「JoinPDF2.3.1」というディレクトリが作成されます。ディレクトリJoinPDF2.3.1内にある「joinPDF2.3.1.pkg」を実行してインストールします。

    ・参考:joinPDF < Mac < kei3.jp

    インストール後、ターミナルを開いて分割したいPDFファイルのあるディレクトリに移動して、下記のコマンドを実行します。
    $ splitPDF name.pdf

    分割されたPDFファイルは同じディレクトリに「name_page1.pdf, name_page2.pdf, ...」というファイル名で作成されます。


    PDFからJPEGへ変換


    分割後のPDFをJPEGに変換するには、PDFがあるディレクトリ内で下記のコマンドを実行します。
    $ for LIST in `ls -1 *_page*`;do NAME=`echo ${LIST} | cut -d. -f1`;sips -s format jpeg ${LIST} --out ${NAME}.jpg;done

    同じディレクトリにPDFファイルと同じ名前(拡張子はjpeg)で作成されます。この場合だと「name_page1.jpeg, name_page2.jpeg, ...」というファイル名になります。

    以上です。


    【雑記】
    電子書籍化したPDFをKindle向けのPDFに変換するためにChainLPを使います。ChainLPではjpegを扱うので、これで編集用のjpegファイルの作成が完了しました。

      このエントリーをはてなブックマークに追加 Share on Tumblr Clip to Evernote
    裁断済み本を電子書籍化するときの「ScanSnap S1300」の設定をご紹介します。

    ・参考:ScanSnap S1500 の設定まとめ - 電子書籍を自炊するときの 10 のポイント - 彼女からは、おいちゃんと呼ばれています

    ほとんど上記の参考サイト通りに設定しました。


    保存先:Dropbox


    保存先のフォルダに「Dropbox」内のフォルダを指定して、スキャン後にすぐにバックアップを取れるようにしています。

    28)
    Dropboxをまだ使ってない方は下記リンクをご参考にして下さい。
    【ツール】DropBox導入 - バコラー日記


    画質の選択 : スーパーファイン


    「スーパーファイン(カラー/グレー:300dpi、白黒:600dpi)」

    18)



    カラーモードの選択 : グレー


    「自動」が楽なのですが、汚れやゴミで「カラー」になってしまう恐れがあるので「グレー」をオススメします。
    ただ、古くなって黄ばんでいる小説やマンガは
    「グレー」モードでスキャンしたほうが、見た目はキレイです。
    (「白黒」を選択すると、特に画像や塗りつぶし部分が、
    画質が劣化したように見えてしまうので、「グレー」がオススメ。)


    読み取り面の選択 : 両面読み取り


    本は両面に印刷されたものがほとんどなので「両面読み取り」を選択します。


    継続読み取りを有効にします:選択


    本をスキャンする場合は「継続読み取りを有効にします」にチェックを入れておきます。
    ScanSnap S1300で1回に読み込める最大枚数は10枚なのですが、大抵の本は10枚以上だと思うので何も考えずに選択しときましょう。


    読み取りモードオプション


    「見開き表示」ではなく「1枚毎の表示」で読むつもりなので、読み取りモードオプションの「白紙ページを自動的に削除します」を選択します。
    28)
    また、「見開き表示」で読みたい方は、ページの順番が少しずつずれてしまうので「白紙ページを自動的に削除します」のチェックは外しておきましょう。

    <「文字をくっきりします」: オフ >
    これをオンにすると、OCR テキスト認識の精度が落ちてしまいます。

    <「文字列の傾きを自動的に補正します」: オフ >
    これをオンにすると、たまに余計見づらくなる方向へ傾けられてしまいます(特に雑誌で頻出)。
    ScanSnap に紙をセットする段階で傾かないようにすべきです。

    <「原稿の向きを自動的に補正します」: オフ >
    書籍はたいてい既に同一の向きに揃っていると思われるので、電子書籍の自炊に限っていえば不要です。



    ファイル形式の選択 : PDF(*.pdf)


    PC、iPad、Kindle、iPhoneなどあらゆるデバイスで読めるように、PDFファイルで出力します。
    PDFファイルならOCR処理をすればテキスト検索ができるのでかなり便利です。

    04)


    テキスト認識の選択 : オン


    テキスト認識を可能にするためには「検索可能なPDFにします」を選択します。
    テキスト認識は、ScanSnap で行うよりも、Adobe Acrobat で行ったほうが良いです。

    当然、Adobe Acrobat でOCR処理をした方が精度がいいと思いますが、あいにくAcrobatを購入するお金がありません。ScanSnapのOCR処理でも、そこそこの精度でテキスト検索できます。現状、ScanSnapのもので困ってません。(図中の文字の検索精度がイマイチ)

    Adobe Acrobat X Standard Windows版
    アドビシステムズ (2010-12-01)
    売り上げランキング: 156


    PDFフォーマットオプション : 1つのファイルにする


    本1冊をスキャン後、1つのPDFファイルにするためには「すべてのページを1つのPDFファイルにします」を選択します。
    10)

    原稿サイズ : カスタマイズ


    デフォルトの「サイズ自動検出」でもいいと思いますが、本のサイズにきっちり合わせたい場合は「カスタマイズ」で追加したサイズを選択しましょう。

    32)

    定規などで本の長さを測ってから「カスタマイズ」から「カスタム原稿の追加」を行います。

    36)

    マルチフィード検出 : 長さで検出


    ScanSnap S1300が2枚以上取り込んでしまった場合、エラーを検出してくれるのでチェックを入れておきましょう。


    圧縮率 : 3(標準)


    圧縮率によるファイルサイズの差は数MB〜数十MBぐらいの違いだと思うので、デフォルトの3のままでやりました。


    まとめ


    自炊のノウハウって経験的なものが大部分を占めると思うので、他にオススメの設定方法があれば教えて頂きたいです。


    FUJITSU ScanSnap S1500 FI-S1500
    富士通 (2009-02-07)
    売り上げランキング: 212

    プラス 断裁機 裁断幅A4 PK-513L 26-106
    プラス (2009-09-01)
    売り上げランキング: 257

    このページのトップヘ