シェルを使ったデータ処理

前回、前々回に引き続き、シェルを使った操作を練習しましょう。今回はsedawkgreplessなどを使い、データの確認を行います。

  1. 以前の演習でhomeに作成したinfovisフォルダに移動してください。

  2. dataという名前のフォルダを作成し、作成したフォルダに移動してください。

  3. seq -f "Line %g" 10 > lines.txt を実行し、練習で使うダミーファイルを作成してください。

  1. headsed、またはawkを使ってlines.txtの先頭3行を出力してください。
  1. lines.txtの最後の3行を出力してください。
  1. lines.txtの奇数行を出力してください。
  1. lines.txtの偶数行を出力してください。
  1. Project GutenbergからAlice’s Adventures in Wonderland (https://www.gutenberg.org/cache/epub/11/pg11.txt) をダウンロードして、alice.txtとして保存します。
  1. wcで行数、単語数、文字数を調べてみましょう。どの値がどれに対応するでしょうか?
  1. lessを使ってalice.txtの中身を確認してみましょう。kjで上下移動、qで退出することができます。
  1. grepを使い、alice.txtからすべての章見出しを抜き出してみましょう。
  1. 今度はgrepで正規表現を使い、先頭が「The」になっている章見出しだけを抜き出してください。
  1. grepを使い、alice.txtから2文字以上の単語をすべて抽出し、alice-words.txtとして保存しましょう。
  1. 現在の作業ディレクトリをGitリポジトリにしてください(すでにGitリポジトリ内で作業している人は新しく作成しなくても問題ありません)。
  1. このウェブサイトを参照し、GitHubにリモートリポジトリを作成しましょう。「ローカルのリポジトリをGitHubに登録」まで行ってください。

  2. ローカルリポジトリをGitHubリポジトリにプッシュし、先程作成したalice-words.txtがGitHubに表示されているスクリーンショットをコメントシートに提出してください。