第4回

シェルを使ったデータ処理

前回、前々回に引き続き、シェルを使った操作を練習しましょう。今回はsed、awk、grep、lessなどを使い、データの確認を行います。

Hint

seqコマンドについても調べてみてください。

Hint
cat lines.txt | head -n 3
# or
cat lines.txt | sed -n '1,3p'
# or
cat lines.txt | awk 'NR<=3'
それぞれのコマンドについて調べてみましょう。

Hint

tailを使ってみましょう。

Hint

cat lines.txt | awk 'NR%2'

Answer

cat lines.txt | awk '(NR+1)%2'

Project GutenbergからAlice’s Adventures in Wonderland (https://www.gutenberg.org/cache/epub/11/pg11.txt) をダウンロードして、alice.txtとして保存します。

Hint

curl https://www.gutenberg.org/cache/epub/11/pg11.txt > alice.txt

Hint

wc alice.txt

Hint

less alice.txt

Hint

grep -i chapter alice.txt

Hint
grep -E 'CHAPTER (.*)The' alice.txt
「正規表現」についても調べてみましょう。

Hint

grep -oE '\w{2,}' alice.txt

Answer

grep -oE '\w{2,}' alice.txt > alice-words.txt

Hint

git init

このウェブサイトを参照し、GitHubにリモートリポジトリを作成しましょう。「ローカルのリポジトリをGitHubに登録」まで行ってください。
- 「SSH公開鍵の作成」で「id_rsa」ではなく「id_ed25519」が表示されても問題ありません。
- 同じページのここに少し詳しく書かれています。
- 『暗号解読』（サイモン・シン）も面白い。
ローカルリポジトリをGitHubリポジトリにプッシュし、先程作成したalice-words.txtがGitHubに表示されているスクリーンショットをコメントシートに提出してください。