September 2022 – Thinking more…

2022/09/272022/09/27

好用的新Python函式庫

從 It’s Time to Say Goodbye to These Obsolete Python Libraries 看到的幾個好用的新函式庫跟新功能，雖說用新的怕舊的 Python 不能用，但這些新的函式庫或新功能其實也出蠻長一段時間了，現在大部分的 Linux 發行版也都有跟到。

摘錄如下

Pathlib

處理路徑的函式庫，直接看看這幾種用法，就能體會，比起之前的 os.path 直覺太多。

from pathlib import Path

readme = Path("README.md").resolve()

print(f"Absolute path: {readme.absolute()}")
# Absolute path: /home/martin/some/path/README.md
print(f"File name: {readme.name}")
# File name: README.md
print(f"Path root: {readme.root}")
# Path root: /
print(f"Parent directory: {readme.parent}")
# Parent directory: /home/martin/some/path
print(f"File extension: {readme.suffix}")
# File extension: .md
print(f"Is it absolute: {readme.is_absolute()}")

etc = Path('/etc')

joined = etc / "cron.d" / "anacron"
print(f"Exists? - {joined.exists()}")

Secrets

處理密碼的函式庫，簡單很多，而且語意很清楚。

import secrets

value = secrets.token_bytes(length)
value = secrets.token_hex(length)

dataclass

若之前有使用過 named tuple 的話，會覺得這個函式庫很好用，而且語意更清楚。

from dataclasses import dataclass

@dataclass()
class User:
    name: str
    surname: str

u = User("John", "Doe")

f-string

Python 從最早期的 “%s” % (name, ) 再到 “{}”.format(name) ，再到 f-string，f-string 讓格式化字串更為清楚，也不容易搞錯。

name = "John"
print(f"Hello {name}!")

結論

定期升級語法，可以帶來效能提升，也可以讓程式更具可讀性，是蠻值得安排時間去逐步更新的。

同場加映：Python 3.11–5個新功能 – anfinance – Medium

2022/09/242022/09/24

傳遞環境變數到 awk script 裡

之前傻傻的以為在 awk script 裡用 ${var} 就可以使用環境變數，但實測結果是不行的，後來才找到 Can we use shell variable in awk?

使用方法很簡單，執行 awk 時用 -v var=${env_var} ，在 awk script 裡就可以使用 var 變數來取得環境變數。

echo "" | awk -v HOME=${HOME} '{print HOME}'

找出指定欄位符合條件的列

想找出其中一欄符合條件的所有列，又不想用 grep，找到這篇 Using awk with column value conditions 跟這篇 AWK 判斷有符合的字串或條件再印出資料，就直接用指定欄位的變數來判斷就可以，例如 $1

awk '$1 == "findtext" {print $0}' input.txt

忽略註解

下面範例是忽略註解，計算行數的，從 AWK: is there some flag to ignore comments? 看來的

awk '/^[[:space:]]*#/ { NR-- } {sum+=$3} END { ... }' coriolis_data
awk '{ if ($0 ~ /^[[:space:]]*#/) {NR--} else {sum+=$3} END { ... }' coriolis_data

2022/09/222023/05/20

vim基本款設定與常用指令、按鍵整理

去客戶那邊的時候，vim 設定一定都要重來過的，如何在最快的時間設定成自己想要的樣子？

目前自己的基本設定

set et
set ts=2
set sw=2
set autoindent
set nu
colorscheme desert

這樣就足夠了，太多也記不住。

再來是常用指令

指令	說明
`:set wrap`	超過螢幕寬度就換行
`:set nowrap`	超過螢幕寬度不換行
`/\ccopyright` `:set ignorecase`	搜尋不分大小寫，可參閱 `:help ignorecase` 或 `:help smartcase`
`:set nu`	顯示行號
`:set nu!`	隱藏行號
`:tabedit filename`	在新頁籤開啟指定檔案
`:tabnew`	開新頁籤
`:ls`	列出所有開啟的檔案 (buffer)
`:b1`	切到第一個檔案 (buffer)
`:set paste`	設定為貼上，不要管 auto indent
`:set nopaste`	不要設定為貼上，這樣若有 autoindent 時，會自動縮排
`:wq`	最重要的指令，存檔然後離開。若加上 `!` 表示強制存檔後離開。
:set mouse= 或 :set mouse=r 或 :set mouse=v	設定不要為 a 就可以使用標準系統的選取、複製模式

常用按鍵

Mode	按鍵	說明
Normal	`ctrl+w s`	分割畫面-橫切
Normal	`ctrl+w v`	分割畫面-直切
Normal	`ctrl+w c`	關閉當前窗格
Normal	`ctrl+w j` / `ctrl+w k` / `ctrl+w h` / `ctrl+w l`	移到下面/上面/左邊/右邊的窗格
Normal	`gt`	到下個頁籤
Normal	`gT`	到上個頁籤
Insert	`ctrl+x ctrl+p`	表示往前找有輸入過的來作自動完成
Insert	`ctrl+x ctrl+f`	自動完成檔名

參考資料

2022/09/172022/09/17

更新sudoers檔案內容

一般更新 /etc/sudoers 檔案內容都是使用 visudo 指令進行；若是要管理 sudoer ，Ansible 可以用 community.general.sudoers 模組來管理。

那如果要在腳本裡更新，該怎麼做呢？這時候可以參考 How do I edit /etc/sudoers from a script? 裡的作法來進行。

這作法蠻 tricky 的，主要是利用 EDITOR 環境變數把 visudo 預設的編輯器換為 tee -a ，這樣就不會開啟 vi 編輯器，而會改用 tee 來處理。來看看這行指令

echo 'foobar ALL=(ALL:ALL) ALL' | sudo EDITOR='tee -a' visudo

| 的左邊是很單純的 echo，這裡可以放置要放進去的設定
| 的右邊就是 sudo 跟 visudo ，這是用 sudo 執行 visudo 指令，並且把編輯器換為 tee -a

這樣組合以後，就可以把設定放到 /etc/sudoers 裏面去了。

另外一種比較單純的作法就是在 /etc/sudoers.d 目錄下去新增檔案，新增以後，因為 /etc/sudoers 裏面有寫 #includedir /etc/sudoers.d ，所以會引用到 /etc/sudoers.d 目錄下的檔案。

2022/09/102022/09/10

如何建立YUM mirror server

在企業裡，因為不會讓所有伺服器都對外，一般會在內部架設一台 YUM mirror server ，定期去 mirror 外部的 RHEL 套件庫。

坦白說，我不知道用哪個名字比較好，知道的名字有

Local mirror
YUM repository server
YUM mirror server

總之，用途都是一致的。

作法

首先這台要作為 mirror 的伺服器必須要對外，接著在伺服器裡，以 subscription-manager 註冊到 RHEL 服務去。

安裝做 mirror 的套件，這邊選用 apache，也可以用 nginx，路徑跟設定調整一下就可以。

yum install yum-utils createrepo httpd

使用 subscription-manager 查看可以下載的 repository

subscription-manager repos --list

接著對需要做 mirror 的 repository 去做 mirror

mkdir -p /var/www/html/{baseos,appstream}
reposync -p /var/www/html/baseos \
        --download-metadata \
        --repo=rhel-8-for-x86_64-baseos-rpms \
        --delete \
        --downloadcomps

reposync -p /var/www/html/appstream \
        --download-metadata \
        --repo=rhel-8-for-x86_64-appstream-rpms \
        --delete \
        --downloadcomps

這邊可以寫成一個腳本，然後設定 cron，定期去執行 mirror。

一般會再多寫一個 repo 檔案，放在 /var/www/html ，後續到其他主機時，可以直接下載這個 repo 檔案，放到 /etc/yum.repos.d 裡面，就可以直接 yum update 。

[baseos]
name=baseos
baseurl=http://<ip>/rhel-8-for-x86_64-baseos-rpms/
enabled=1
gpgcheck=0

[appstream]
name=appstream
baseurl=http://<ip>/rhel-8-for-x86_64-appstream-rpms/
enabled=1
gpgcheck=0

最後啟用 httpd，就大功告成了。

systemctl enable --now httpd

限制

使用這個方法，基本上一台主機就是對應一個版本，例如 7.9, 8, 8.5, 8.6 這樣，沒辦法有多個版本，若需要有多個版本，建議使用 Foreman 或是 Satellite 會比較方便。

參考資料

How to create a local mirror of the latest update for Red Hat Enterprise Linux 5, 6, 7, 8 and 9 without using Satellite server?

2022/09/102022/09/10

bash arguments cheatsheet

記錄關於 bash argument 的幾則常用語法。

argument 一般翻譯為引數或參數，帶有 — 的，會被稱為選項。

prog arg1 arg2 arg3
prog --output option1 arg1

arg1, arg2, arg3 就是引數；–output option1 就是選項。

寫 shell script 時，是不管 — 的，在 prog 之後的，都叫做引數。以下用法均以 prog arg1 arg2 arg3 作為範例

用法	說明	結果
$#	取得引數個數	3
$@	所有引數	arg1 arg2 arg3
myArray=(“$@”)	轉為 Array	會印出 arg1，要遍訪，需用 for：
myArray=(“$@”) echo “${myArray}”	只印出Array第一個元素	arg1
for arg in “${myArray[@]}”; do echo -n “${arg},”; done	遍訪Array所有元素	arg1,arg2,arg3,
myArray=( “$@” ) arraylength=${#myArray[@]} for (( i=0; i<${arraylength}; i++ )); do echo “${myArray[$i]}” done	遍訪Array所有元素的另一個作法，用索引方式。	arg1 arg2 arg3
`if ["$#" -eq 0]; then echo "no argument"; fi`	判斷是有否引數	若無引數，印出 “no argument”
B=(“${myArray[@]:1:2}”) echo “${B[@]}”	做slice	arg2 arg3
version=4.7.1 A=( ${version//./ } ) echo “${A[@]}”	split	4 7 1
a=”HELLO WORLD” `echo "${a,,}"` echo “${a,,[AEIUO]}”	轉小寫	hello world HeLLo WoRLD
a=”hello world” `echo "${a^^}"`	轉大寫	HELLO WORLD

參考資料

2022/09/032022/09/03

atuin

atuin 可以把指令歷史改放到 sqlite db 裡，提供了 fancy 的畫面跟功能，還蠻酷的。它在雲端有提供 sync 伺服器，可以把指令同步上去，我本來在想這會有安全疑慮吧，畢竟有些時候指令就會帶密碼。不過，atuin 已經有做加密了，放上去是安全的。

atuin sync 伺服器也可以自行架設，除了可以同步之外， sync 伺服器還有提供一個類似 github graph 的功能，可以看到活動圖，蠻有趣的。

安裝

bash <(curl https://raw.githubusercontent.com/ellie/atuin/main/install.sh)

如果想試試預設的 sync 伺服器，就先用 atuin register 來註冊

atuin register -u <USERNAME> -e <EMAIL> -p <PASSWORD>

若不需要，就匯入目前的 history

atuin import auto

設定

如果是使用 bash ，就用以下指令，把設定放到 .bashrc

curl https://raw.githubusercontent.com/rcaloras/bash-preexec/master/bash-preexec.sh -o ~/.bash-preexec.sh
echo '[[ -f ~/.bash-preexec.sh ]] && source ~/.bash-preexec.sh' >> ~/.bashrc
echo 'eval "$(atuin init bash)"' >> ~/.bashrc

若是 zsh ，就改用以下指令，把設定放到 .zshrc 裡

echo 'eval "$(atuin init zsh)"' >> ~/.zshrc

設定好，就關掉終端機，開新的終端機，或者是登出，重新再登入，設定就生效了。

使用

使用很簡單，按下 ctrl+r 或是按上，就會看到 atuin 的畫面，輸入字母，上方就會篩選出相關的指令。

那也可以打指令去找，例如找昨天下午3點以前的 ls 指令

atuin search --exit 0 --after "yesterday 3pm" ls

相當簡單。

架設 sync 伺服器的部份有空再來試好了，目前就先都以本機使用為主。

想法

其實就現在來說，使用 ctrl+r 就已經很方便，而且也不需要安裝，直接就能使用。未來會有需要集中管理指令歷史功能的強烈需求嗎？我想可能是沒有，就先用一陣子試試看好了，一周以後再來評估是否要繼續使用。

2022/09/032022/09/03

HAProxy

去年因為需要建置 OpenShift 容器平台而接觸到了 HAProxy，才知道為什麼 AWS 上會有分 Application Load balancer 等不同類型的負載平衡器。

簡單的說，HAProxy 的負載平衡模式分為兩種，一種是 HTTP mode，一種是 TCP mode；也就是 Layer 7 跟 Layer 4。建置 OpenShift 容器平台時，是使用 TCP mode ，Layer 4 的模式，當 HAProxy 收到連線請求時，是直接看哪一個 backend node 可以用，就直接左手給右手，連線到該台 backend node。那 HAProxy 也可以設定為 HTTP mode ，在這種模式下，就像是 nginx/apache 的 reverse proxy ，可以在 frontend 加上憑證跟做 VirtualHost。

安裝很簡單，Ubuntu 跟 RHEL 都有提供

sudo apt install -y haproxy
sudo yum install -y haproxy

安裝以後，設定檔位置是在 /etc/haproxy.cfg

主要需要調整的是 frontend 跟 backend

global
        log /dev/log    local0
        log /dev/log    local1 notice
        chroot /var/lib/haproxy
        stats socket /run/haproxy/admin.sock mode 660 level admin expose-fd listeners
        stats timeout 30s
        user haproxy
        group haproxy
        daemon

defaults
        log     global
        mode    http
        option  httplog
        option  dontlognull
        timeout connect 10s
        timeout client  60s
        timeout server  60s
        errorfile 400 /etc/haproxy/errors/400.http
        errorfile 403 /etc/haproxy/errors/403.http
        errorfile 408 /etc/haproxy/errors/408.http
        errorfile 500 /etc/haproxy/errors/500.http
        errorfile 502 /etc/haproxy/errors/502.http
        errorfile 503 /etc/haproxy/errors/503.http
        errorfile 504 /etc/haproxy/errors/504.http

frontend http_bind
        bind *:80
        mode tcp
        option tcplog
        default_backend router_http


frontend https_bind
        bind *:443
        mode tcp
        option tcplog
        default_backend router_https

backend router_http
        mode tcp
        server router_server router:80

backend router_https
        mode tcp
        server router_server router:443

frontend 決定 haproxy 要 listen 哪一個 port，backend 決定是由哪個 node 來處理連線，很容易理解。(聽同事說，這跟 F5 的設定也很接近。)

在 RHEL 會比較容易遇到 HAProxy 有問題，主因是 SELinux ，在啟動 HAProxy 前，需要先使用 setsebool 來設定：

getsebool -a | grep haproxy_connect_any
setsebool haproxy_connect_any on

跟 HAProxy 相關的 SELinux 設定可以用 man 8 haproxy_selinux 來查詢。

M	T	W	T	F	S	S
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30

Month: September 2022

好用的新Python函式庫

Pathlib

Secrets

dataclass

f-string

結論

bash 檢查檔案是否為空的

近日學到的幾個 awk 用法

傳遞環境變數到 awk script 裡

找出指定欄位符合條件的列

忽略註解

vim基本款設定與常用指令、按鍵整理

參考資料

更新sudoers檔案內容

如何建立YUM mirror server

作法

限制

參考資料

bash arguments cheatsheet

參考資料

atuin

安裝

設定

使用

想法

HAProxy

參考資料