Speech recognition(음성인식) (2) 특징 추출(feature extraction)

이전 포스트에서는 음성인식의 개요와 사람이 어떻게 음성을 인식하는지에 대해 다루어 보았다 이번 포스트에서는  공학적으로 음성 인식을 어떻게 적용할지에 대하여 다우어 보겠다. 이전 포스트에서 위 waveform에서 어떻게 word sequence 를 추출할지에 대하여 질문을 던졌다. 위 그림만 봐서는 어떤 word인지 감을 잡을 수 없으나 무었인가 규칙이 있을 것 같다. 위는 각기 다른사람이 bird를 발음 한것이다.  음운적으로 비슷한가? 그러면…

더 보기

ubuntu 에서 windows 사용하기 (gnome-boxes)

우분투를 사용하며 가끔씩 윈도우를 사용해야할 때가 있어서 간단하게 사용 할 수 있는 gnome-boxes 라는 VM을 이용하여 windows를 설치하여 보았다. 설치 sudo apt-get updatesudo apt-get install gnome-boxes 실행 터미널에 gnome-boxes& 라고 입력하면 다음과 같이 실행된다. 윈도우 설치 링크에서 윈도우10 iso 를 다운로드 한다. gnome-boxes 에서 새로만들기를 클릭 한 후 iso 파일을 클릭한다. 세부설정을 완료한후 만들기를 클릭한다. 윈도우…

더 보기

Speech recognition(음성인식) (1) 개요

2018/9/20 일 전면_수정 음성인식이란? 음성 인식이란 사람이 말하는 음성 언어를 컴퓨터가 해석해 그 내용을 문자 데이터로 전환하는 처리를 말합니다. 음성 인식은 아날로그 음성 신호를 디지털로 바꾸는 신호 처리부터 시작하여 신호의 음성적인 특징을 추출하는 일을 말하며 이는 자연어 처리와 같은 응용분야에 있어서도 중요한 역할을 할 수  밖에 없기에 중요한 분야입니다. 응용분야 Human Speech Recognition Process 음성인식문제에…

더 보기

NVLINK란? 간단한 정리

NVLINK에 대한 정보를 찾던중 ULTRA-PERFORMANCE PASCAL GPU AND NVLINK INTERCONNECT 을  정리 전반적인 특징 Pascal Architecture에서는 Maxwell Architecture과 비교해서 다음과 같은 변화가 생겼다. (Tesla시리즈의 비교기때문에 모든 제품에 적용하기에는 무리가 있다.) 특징들 Tesla M40 Tesla P100 architecture GM200/Maxwell GP100/Pascal Streaming multiprocessors 24 56 FP16(반정밀도) flops/clock/SM -(FP16연산유닛이 없다) 256 FP32(단정밀도) flops/clock/SM 256 128 FP64(배정밀도) flops/clock/SM 8 64 GPU…

더 보기

ElementryOS mouch pad Using it like a Mac Touch Gestures (Loki,Juno)

Adding Gestures # Add yourself to the input group sudo gpasswd -a $USER input # Install dependencies sudo apt-get install xdotool wmctrl libinput-tools # Clone and install git clone http://github.com/bulletmark/libinput-gestures cd libinput-gestures sudo ./libinput-gestures-setup install Create a custom configuration file vim ~/.config/libinput-gestures.conf Reference

더 보기

Logitech MX anywhere 2s 우분투에서 제스쳐 사용하기

Logitech 마우스는 options 라는 소프트웨어를 기본적으로 제공하여 키맵변경 logitech flow 등 많은 기능을 사용할 수 있다. 그러나 options 가 mac과 windows에서만 제공하는 바람에 9만원이나 하는 마우스가 그냥 돌덩이가 되어버렸다. 그러나 역시 리눅스에서 사용할 수 있는 방법이 있었다.   아래 방법을 사용하여 xautomation xbindkeys 을 설치 후 마우스의 키세팅을 알아본다.(버튼은 글쓴이가 다 알아놨으니 걱정하지 않아도 된다.) 배시창을 연다…

더 보기

How to use Logitech MX Anywhere 2S gesture in Ubuntu 16.04

This document was validated in ubuntu 16.04 and ubuntu 18.04. Open a console Run apt -y install xautomation xbindkeys to install dependencies Run xev | tee mouse.log and a black box will appear Move cursor into the black box, press all the function buttons in a certain order (don’t forget it!) Search mouse.log  for ButtonPress and you’ll find the “state” and…

더 보기

jetson tx2 사용기 2 opencv 예제1

opencv를 이용하여 빈 img 를 만든후 text를 입력하는 예제 hello.cpp #include<opencv2/highgui/highgui.hpp>#include “opencv2/opencv.hpp”int main(){# 512 x512 img 를 8비트 unsigned RGB로 Mat으로 만든다.cv::Mat img(512,512,CV_8UC3,cv::Scalar(0));# img의 중간에 OpenCV on Jetson! 이라는 문구를 집어넣는다. 색은 초록색 1.0의 크기로cv::putText(img,”Hello, OpenCV on Jetson!”,cv::Point(10,img.rows/2),cv::FONT_HERSHEY_DUPLEX,1.0,CV_RGB(118,185,0),2);# Hello 라는 이름의 window를 생성 img 를 그린다. cv::imshow(“Hello”,img);cv::waitKey();} 컴파일을 위하여 cmake를 설치한다. sudo apt-get install cmake CmakeLists를 작성한다….

더 보기

jetson tx2 사용기 1 개봉 및 프로그램 설치

jetson tx2는 nvidia 에서 출시한 임베디드 추론가속기이다. nvidia의 설명은 다음과 같다.  고성능, 저전력 NVIDIA Jetson TX2를 사용하여 가장 필요한 곳에서 실시간 인공 지능(AI) 성능을 활용하십시오. 이제 복잡한 데이터를 온보드 에지 장치에서 처리할 수 있습니다. 따라서 로봇 및 드론에서 엔터프라이즈 협업 장치 및 지능형 카메라에 이르는 모든 장치에서 빠르고 정확한 추론을 신뢰할 수 있습니다. 에지에 AI를…

더 보기