From 6fd9902aab3b630635a8190be762ab22564e9243 Mon Sep 17 00:00:00 2001
From: "Matthias@Dell" <matthiasqui@protonmail.com>
Date: Thu, 27 Apr 2023 01:53:47 +0200
Subject: [PATCH] initial commit

---
 readme.md                                     |   2 +
 teng-ml/main.py                               |  29 ++++
 teng-ml/prepare.py                            | 145 ++++++++++++++++++
 .../__pycache__/transform.cpython-310.pyc     | Bin 0 -> 2143 bytes
 teng-ml/util/data_loader.py                   |  25 +++
 teng-ml/util/transform.py                     |  47 ++++++
 6 files changed, 248 insertions(+)
 create mode 100644 readme.md
 create mode 100644 teng-ml/main.py
 create mode 100644 teng-ml/prepare.py
 create mode 100644 teng-ml/util/__pycache__/transform.cpython-310.pyc
 create mode 100644 teng-ml/util/data_loader.py
 create mode 100644 teng-ml/util/transform.py

diff --git a/readme.md b/readme.md
new file mode 100644
index 0000000..cdd7616
--- /dev/null
+++ b/readme.md
@@ -0,0 +1,2 @@
+# Machine Learning stuff for TENG project
+
diff --git a/teng-ml/main.py b/teng-ml/main.py
new file mode 100644
index 0000000..17cb8a3
--- /dev/null
+++ b/teng-ml/main.py
@@ -0,0 +1,29 @@
+import matplotlib.pyplot as plt
+import pandas as pd
+
+if __name__ == "__main__":
+    if __package__ is None:
+        # make relative imports work as described here: https://peps.python.org/pep-0366/#proposed-change
+        __package__ = "teng-ml"
+        import sys
+        from os import path
+        filepath = path.realpath(path.abspath(__file__))
+        sys.path.insert(0, path.dirname(path.dirname(filepath)))
+
+from .util.transform import ConstantInterval
+
+if __name__ == "__main__":
+    file = "/home/matth/data/2023-04-25_kapton_8.2V_179mm002.csv"
+    # file = "/home/matth/data/test001.csv"
+    df = pd.read_csv(file)
+    array = df.to_numpy()
+    print(ConstantInterval.get_average_interval(array[:,0]))
+    transformer = ConstantInterval(0.05)
+    interp_array = transformer(array[:,0], array[:,2])
+
+    fig1, ax1 = plt.subplots()
+    ax1.plot(interp_array[:,0], interp_array[:,1], color="r", label="Interpolated")
+    ax1.scatter(array[:,0], array[:,2], color="g", label="Original")
+    ax1.legend()
+    plt.show()
+
diff --git a/teng-ml/prepare.py b/teng-ml/prepare.py
new file mode 100644
index 0000000..18f3456
--- /dev/null
+++ b/teng-ml/prepare.py
@@ -0,0 +1,145 @@
+import pandas as pd
+import numpy as np
+import scipy.signal as signal
+import matplotlib.pyplot as plt
+from time import sleep
+from random import choice as r_choice
+from sys import exit
+
+from .util.transform import Normalize
+
+if __name__ == "__main__":
+    if __package__ is None:
+        # make relative imports work as described here: https://peps.python.org/pep-0366/#proposed-change
+        __package__ = "teng-ml"
+        import sys
+        from os import path
+        filepath = path.realpath(path.abspath(__file__))
+        sys.path.insert(0, path.dirname(path.dirname(filepath)))
+from .utility.data import load_dataframe
+
+file = "/home/matth/data/2023-04-25_kapton_8.2V_179mm002.csv"
+
+class PeakInfo:
+    """
+    Helper class for "iterating" through selected peaks.
+    """
+    def __init__(self):
+        self.reset()
+
+    def reset(self):
+        self._peak_names = [ "first", "second", "last", "lowest" ]
+        self._peaks = { p: None for p in self._peak_names }
+        self._iter = 0
+
+    def current(self):
+        # return (self._peak_names[self._iter]), self._peaks[self._peak_names[self._iter]]
+        return self._peaks[self._peak_names[self._iter]]
+    def name(self):
+        return self._peak_names[self._iter]
+
+    def next(self):
+        if self._iter < len(self._peak_names) - 1: self._iter += 1
+        return self.current()
+    def prev(self):
+        if self._iter > 0: self._iter -= 1
+        return self.current()
+
+    def set(self, value):
+        """Assign a value to the current peak"""
+        self._peaks[self._peak_names[self._iter]] = value
+    def is_done(self):
+        for peak in self._peaks.values():
+            if peak is None: return False
+        return True
+
+    def __getitem__(self, key):
+        return self._peaks[key]
+    def __setitem__(self, key, value):
+        self._peaks[key] =  value
+    def __repr__(self):
+        return f"{self._peak_names[self._iter]} peak"
+
+
+def find_peaks(a):
+    peaks = signal.find_peaks(a)
+
+
+def on_click(fig, ax, peaks, event):
+    """
+    Let the user select first, second and last peak by clicking on them in this order.
+    Right click undos the last selection
+    """
+    select = None
+    if event.button == 1:  # left click
+        peaks.set((event.xdata, event.ydata))
+        print(f"{peaks}: {event.xdata} - {event.ydata}")
+        ax.set_title(f"{peaks}: {event.xdata} - {event.ydata}")
+        peaks.next()
+    elif event.button == 3:  # right click
+        ax.set_title(f"Undo {peaks.name()}")
+        if not peaks.is_done():
+            peaks.prev()
+        peaks.set(None)
+    if peaks.is_done(): message = "Close window when done"
+    else: message = f"Click on {peaks}"
+    fig.suptitle(message)
+    fig.canvas.draw()
+    # fig1.canvas.flush_events()
+
+def calc_peaks(peaks):
+    # get the peak points from the information of a Peaks object
+    # 90% distance between first and second
+    min_distance = max(1, (peaks["second"][0] - peaks["first"][0]) * 0.9)
+    min_height = peaks["lowest"][1] * 0.99
+    vpeaks = signal.find_peaks(vdata, height=min_height, distance=min_distance)
+    return vpeaks
+
+
+if __name__ == "__main__":
+    """
+    Peak identification:
+    plot, let user choose first, second, last and lowest peak for identification
+    """
+    df = load_dataframe(file)
+    a = df.to_numpy()
+
+    # a2 = interpolate_to_linear_time()
+    # print(a2)
+    # exit()
+
+    vdata = Normalize(0, 1)(a[:,2])
+    plt.ion()
+    # vpeaks[0] is the list of the peaks
+    vpeaks = signal.find_peaks(vdata)[0]
+    fig, ax = plt.subplots()
+    ax.plot(vdata)
+    peak_lines = ax.vlines(vpeaks, 0, 1, colors="r")
+    ax.grid(True)
+    fig.suptitle("Click on first peak")
+    peak_info = PeakInfo()
+    # handle clicks
+    fig.canvas.mpl_connect("button_press_event", lambda ev: on_click(fig, ax, peak_info, ev))
+    # run until user closes, events are handled with on_click function
+    print(vdata.size)
+    while plt.fignum_exists(fig.number):
+        plt.pause(0.01)
+        if (peak_info.is_done()):
+            vpeaks = calc_peaks(peak_info)[0]
+            x_margin = (a[-1,0] - a[0,0]) * 0.05   # allow some margin if user clicked not close enough on peak
+            vpeaks = vpeaks[(vpeaks >= peak_info["first"][0] - x_margin) & (vpeaks <= peak_info["last"][0] + x_margin)]   # remove peaks before first and after last
+            peak_lines.remove()
+            peak_lines = ax.vlines(vpeaks, 0, 1, colors="r")
+            peak_info.reset()
+    print(a[:,0], vpeaks)
+
+    # separate peaks
+    indices = np.arange(0, a[:,0].size)
+    peak_datas = []
+    for i in range(len(vpeaks) - 1):
+        # TODO: user <= or <
+        peak_datas.append(vdata[(indices >= vpeaks[i]) & (indices < vpeaks[i+1])])
+        plt.plot(peak_datas[i])
+    print(peak_datas)
+    plt.pause(20)
+
diff --git a/teng-ml/util/__pycache__/transform.cpython-310.pyc b/teng-ml/util/__pycache__/transform.cpython-310.pyc
new file mode 100644
index 0000000000000000000000000000000000000000..9ccaebd778c0d2794cf8f8e52b6b6353722d9c6b
GIT binary patch
literal 2143
zcma)6Igb=a6t3!PddGvc;5FKnEvt+$V&rAVNDhnz7zrZ;!6e{hB&*e)s-0=*i>lgd
zG@E!<GO1%^2?7V?PW)Fob;MsFvA<Wnv&$8@TJ^flSMT`VSDiW2WoUn1x+nh*8T*GO
zZ#Ey3Tj=In2+1VR*@)xs<zC^Be9rDN>C51V$zb7)0?a}gVHRN)O8$WLJFjq)4g0)_
zv(hSEUzKB8d9$6oasjK#y)g15ANg`c1~NS2qd-QobHt!ChR$xYGOTow=Gjcme&`Cc
zayb{K5_Xzek><JBP4gXPM5>keMcF;2N|9H4A}ytuW|OJAsW~2fMPf{LEE|nI^xNp>
zbBH;gdykok?z3Mx#w=lT4-(OMz+UoU-)ns6ZUR!=_nW||d|OAjs5=lZnO?!~^|isY
zD%7Azt(^{jDzm}EJHxw!`rwLH<>X3{50?KOn_;5U(rm-Et@@yelO!uMn<Oz58PeS2
z5%2QZxszaQEsu=J^koY$Aa|TA_c5^SIb3+b4?S{fogH$lV2l-i?o0mI*XOb0e})}$
z^^uPrtg~y&dGMVZAr;=x#jhVWURgJOk(ChXzVq36-w!m|+wgQ0U^jtG_Y)V4RuBNm
zw=oiyBt6W`DnysZ@GZu->UDYWj+gCW1l_%^$-{m`TFSIgNz!zaq^RUhPUBvZJlRR}
z<DE{D$ZDJ<`Xk)Y^wJx)P>M7eq$ysc)sXQq3wYP>1#WeWg|`|Vy@hTzA>Kl-Cw*Wx
za2N)5Rn($*!ABj3<CSLhc2ydimi8Xi2H-mT%Yo8O>ncyJ0-BYOsZE8g#5CPiA{FD~
zTf&tTu8Dy#X;J4&Xk6KJI+lfS6{n=y7sjeuWT=LGFFi0qJ=w`{Q<at!L#NU<%}Qaj
zLb<a}$({XLjjj3KEyL2HHk%?Nb2h~;{oJXy;6~6psT>MsTP;*48XUt;r~t1cffQhU
zo`j43X$mMoU!WUO2AFTW8>>^aQwo-i3WJo~MmHk}>q>Xw9r~6(2d&Jx^fnlw`h|ZO
z*g*Po{wRC~3Y&Ata2~i>G!LG!KjH=FZ0^s41wRaNAFK0l+k3$ub%@+r^uPKSZ5CF!
zym5Kv^~J2SDN40><MM0X@5h?#*97b)N>R`g<=kz;S|fcR3b0rc?IO72#|?kjkJ^Ii
zQX<-jHvvVuiCnhpQ5U+C<DHns2&8#8dW7sR(G6vw%h&it9($`Fj$&I)W8%PNBb$l0
zD6-}f1aZc1Y@16&?<lr_w)LN~1z&hSLV`IES41QjzNdx~@(HOC5EBIc=iVWIill5X
zl9H{n4fNl=Cms}VSIo{EP^!1}O~bR7ToVvl7ad=8ujiSu<Ep4{eod;$T)}47-h;?Q
z*#tGC(}@Cmwl%hOJ+I)hxrxD2OG_a^o2Jh3jV5&I0<o(SNF^Iay>xeSqN%m$BH8B5
zTKmv*m&rilk_$d)?5qD};t;SoOKQ)Npy=r}5+|h9^Z)>xjSFR`mDGLOJguM8BKi~?
z>*$8?M?4mXvF~+0_B8E)GsAMHs1KaqqqAn5)dyQG%pCc&*d-9S^B;PmiLbX*dz0{U
M%$Gg>v3G9mKWY8!%K!iX

literal 0
HcmV?d00001

diff --git a/teng-ml/util/data_loader.py b/teng-ml/util/data_loader.py
new file mode 100644
index 0000000..d1e7fc3
--- /dev/null
+++ b/teng-ml/util/data_loader.py
@@ -0,0 +1,25 @@
+
+def load_data():
+    # Build the category_lines dictionary, a list of names per language
+    category_lines = {}
+    all_categories = []
+
+    def find_files(path):
+        return glob.glob(path)
+
+    # Read a file and split into lines
+    def read_lines(filename):
+        lines = io.open(filename, encoding='utf-8').read().strip().split('\n')
+        return [unicode_to_ascii(line) for line in lines]
+
+    for filename in find_files('data/names/*.txt'):
+        category = os.path.splitext(os.path.basename(filename))[0]
+        all_categories.append(category)
+
+        lines = read_lines(filename)
+        category_lines[category] = lines
+
+    return category_lines, all_categories
+
+
+
diff --git a/teng-ml/util/transform.py b/teng-ml/util/transform.py
new file mode 100644
index 0000000..d468c73
--- /dev/null
+++ b/teng-ml/util/transform.py
@@ -0,0 +1,47 @@
+import numpy as np
+from scipy.interpolate import interp1d
+
+class Normalize:
+    """
+    normalize so that all values are between low and high
+    """
+    def __init__(self, low=0, high=1):
+        assert(low < high)
+        self.low = low
+        self.high = high
+    def __call__(self, a):
+        min_ = np.min(a)
+        a = a - min_
+        max_ = np.max(a)
+        if max_ != 0:
+            a = (a / max_)
+        # now normalized between 0 and 1
+        a *= (self.high - self.low)
+        a -= self.low
+        return a
+
+
+class ConstantInterval:
+    """
+    Interpolate the data to have a constant interval / sample rate,
+    so that 1 index step is always equivalent to a certain time step
+    Expects: timestamps, idata, vdata
+    """
+    def __init__(self, interval):
+        self.interval = interval
+
+    def __call__(self, timestamps, data):
+        interp = interp1d(timestamps, data)
+        new_stamps = np.arange(0, timestamps[-1], self.interval)
+        print(f"old=({timestamps.size}) {timestamps}, new=({new_stamps.size}){new_stamps}")
+
+        new_vals = interp(new_stamps)
+        return np.vstack((new_stamps, new_vals)).T
+    @staticmethod
+
+    def get_average_interval(timestamps):
+        avg_interval = np.average([ timestamps[i] - timestamps[i-1] for i in range(1, len(timestamps))])
+        return avg_interval
+        # sug_interval = 0.5 * avg_interval
+        # print(f"Average interval: {avg_interval}, Suggestion: {sug_interval}")
+