リモートワークで導入して良かったツール詳しく見る

PDFからテキストを抽出する。

じょじお

この記事は現在作成中です。読みづらく申し訳ありません。

目次

「PDFからテキストを抽出」アクションの使い方

STEP
ターゲットとなるPDFを確認します。
STEP
PDFからテキストを抽出アクションを追加します。

▲「PDFからテキストを抽出」アクションは、PDFグループの中にあります。

STEP
PDFからテキストを抽出アクションのパラメータを入力します。
PDFファイル

PDFファイルのパス(場所)を指定します。

抽出するページ

次のいずれかから選択します。

  • すべて
  • 単一
  • 範囲
開始ページ番号

複数ページのPDFをターゲットにする場合に必要です。抽出するページの開始ページ番号を指定します。

終了ページ番号

複数ページのPDFをターゲットにする場合に必要です。抽出するページの開始ページ番号を指定します。

結果

1ページ目のみをターゲットにする場合

2ページ目から3ページ目をターゲットにする場合

特定の文字を抽出する場合

2つの方法があるかと思います。

  1. 文字列操作系のアクションを使って抽出する。
  2. 正規表現を使用して抽出する。

文字列操作系アクションを使って文字列を抽出する方法

▲文字列操作系のアクションで文字列を抽出する方法は下記の記事で解説しています。よろしかったら参考になさってください。

正規表現を使って文字列を抽出する方法

▲正規表現を使った文字列抽出についてはこちらの記事で解説しています。よろしかったら参考になさってください。

画像を抽出するには?

画像を抽出するには「PDFから画像を抽出する」アクションを使用します。

>>「PDFから画像を抽出する」アクションを使用する方法はこちら(記事作成中)

まとめ

じょじお

以上、この記事では「PDFからテキストを抽出」アクションの使い方について解説しました。

ノンプログラマーでも自動化スキルを身につける。

よかったらシェアしてね!
URLをコピーする
URLをコピーしました!
目次
閉じる