반응형
Recently, I read article titled Know When to Stop Designing, Quantitatively. Because first half of article was about mainly information theory which I recently studied in thermal physics, It was very intersting that he is applying this theory into the efficiency issue of user interface.

Introduction of mathematical concepts behind Information theory


These three statements which is belived as a truth about Christmas day.
  1. Christmas day falls on a some day of the year.
  2. Christmas day falls in the second half of the year.
  3. Christmas day falls on the 25th of a month.
Because all days are fall on a some day of the year, the first statement has no new information. The second statement contains more information than first one, at a minimum we know which half of the year the holiday is. The last statement is even more particular and has the most information content.

We can see that more probable statement have less information, If we calculate the probability of the above three statements, the first one will be 1 because it is always true. The second one will be 1/2, and the last one will be 12/365 if we assume that the year is not leap year.

If we add the information above, that can be measured by multiplying two probabilties. Because the first statement has no information, it will be same probability if we multiplying the probability of statements 1 and 2, or 1 and 3. But If we multiplying the probability of statements 2 and 3, the probability will be 6/365.

The probability of two independent true statements are the product of each probabilities. It is obvious to presume that information content can be added. Claude Shannon which is called the father of information theory proposed the definition of information.

Information content  can be calculated using the Q=-k \rm{log} P where P is the probability of the statement and k is some positive constant. Suppose we select \rm{log}_{2}and k =1, then Q is determined in bits.

If we assume W is the number of cases probable, and the probabiltiy of one specific case will be 1/W. So, we can also define the Information content Q = -k log P = -k log (1/W) = -k log (W^(-1)) = -k(-1) log W = k log W.

Various language and Information capacity


In accordance with his calculation, English have approximately 5 bit choice assuming total number of letters is 32. 5 bit choice. Hiragana in Japanese have 76 letters including dakuten and yoon. Katakana has the same number of letters which Hiragana have. and if we use 6 punctuation marks likewise. The number of cases will be 158(76+76+6), and information in bit will be about 7.3 bits. It became Hiragana and Katakana have more information capacity than English letters by 46%. This is not exact, The percentage should be more than that, because I didn't consider Kanji.

In Korean language, one character will be combined using initial, vowel, and final from Jamo in Hangul. The possible number of characters by combinations of Jamo will be 11970. Some of them will be not used in common. Though I ignore 3700 cases of them, the number of bit choice will be more than 13 bit.

There is essential limit of this discussion, because I assume that every language can equally express something or some concept. But it is not true in reality. When we need to introduce new idea that never exists in some cultural envirionment, we have to make additional explanations about that.

It is meaningful in some of senses that the information capacity of one language can be calculated and compared using information as a physical quantity. And it is fun, too.

반응형
반응형
국민일보 쿠키뉴스(네이트 뉴스)에서 어떤 한 학교에서 교내에서 급식을 받지 않는 사람 명단을 게시했다는 기사가 올라왔네요.

학교의 고충도 이해가 가지만, 좀 더 사려깊지 못했던 대책이 아쉽네요.

자의로 안 먹는 사람도 있지만, 만에 하나 못 먹는 사람이 저기 명단에 실려서

그 학생이 받을 상처를 생각하면 저렇게 해서는 안 될 것 같네요. 저런 대책보다는,

학생증의 바코드(교내 도서관 사용할 때의 그런 바코드가 있는 학교라면) 등을 이용해서

급식 받기 전에 찍도록 한다거나 하는 식으로 충분히 익명성을 보장하면서 급식할 수 있는 대안이

찾아보면 있었을 텐데 정말 아쉽고 안타까운 소식이네요.
반응형
반응형
각도의 단위에는 네 가지가 있습니다.

우리가 일반적으로 쓰는 각도법(360도가 원 한바퀴),
호도법(또는 라디안, 2 pi rad가 원 한바퀴)
그레이드(400 gon가 원 한바퀴)
턴 (1 turn 또는 1 revolution 말 그대로 원 한바퀴)

Degree 부분의 위키피디아 표제어를 읽다가 흥미로운 부분을 인용해봅디다.
The selection of 360 as the number of degrees (i.e., smallest practical sub-arcs) in a circle was probably based on the fact that 360 is approximately the number of days in a year. Its use is often said to originate from the methods of the ancient Babylonians.
- 360을 원의 각도를 칭하는 숫자로 정한 이유는 아마 360이 약 1년의 일수가 된다는 사실에 기초했을 것입니다. 360을 쓴 것은 고대 바빌로니아 사람들의 방법에서 비롯했다고 사람들은 이야기합니다.

즉 1년의 숫자가 대략 360이니까 그걸 정했다는 설이 지배적인 것 같습니다. 그것때문에 우리의 직각은 90도 평각은 180도로 결정되었죠. 예전 사람들의 유산(legacy)이 바른 결정이었든 잘못된 결정이었는 현대까지 영향을 미치고 있다는 사례인데요.

키보드의 QWERTY 자판이, 초기 자판이 빨리 입력하면 엉킴이 있기에  일부러 사람들의 자판 입력을 느리게 하려는 목적이었지만,  결국 지금까지 보편화되어 버린 것같은 현상같네요.

라디안의 경우, 삼각함수와 관련된 해석학적 부분에서 수식 결과가 깔끔해진다는 이점 때문에 선호되고 있습니다. 극좌표계, 구면좌표계, 원통좌표계 등과 물리에서는 각속도, 각가속도, 위상차 등에서 쓰이고요.

그레이드라는 단위가 있는데, 이 단위가 좋은 점이 뭐냐면 원이 400 그레이드니까 직각이 100 gon, 평각이 200 gon가 됩니다. 그래서 암산하기가 편리해지죠, 어떤 물체가 17 gon을 향하고 있으면 그 옆에 직각을 향하는 방향은 117 gon 바로 뒤를 향하는 것은 217 gon같은 방식으로 산수가 간단하게 됩니다. 그레이드를 일반화하려는 시도가 있었지만 대부분 실패했고 프랑스 포병대와 몇몇 국가의 전문 영역에서만 채택했다고 합니다.

이 그레이드라는 단위가 또다른 레거시가 되었습니다. 1970~1980년 대에 출시된 공학용 계산기의 각도 변환 모드에 deg, rad, grad 세 종류가 삼각함수 계산을 위해 들어가게 되었습니다. 그레이드라는 단위가 현재 널리 쓰이지 않음에도, 공학용 계산기에는 이 기능이 대부분 포함되어 있죠. 하지만 최근 공학용 계산기에는 그레이드 각도 변환기능을 빼고 그냥 각도법이랑 라디안만 넣고 나오는 경우도 있다고 합니다. 제 계산기 사용 설명서에는 이런 역사적인 내용을 담기에는 담을 내용이 훨씬 많아서 그런지 간단히 기능 소개만 하고 넘어가네요.

턴의 경우에는 복소동역학 쪽에서 외부각과 내부각을 잴 때 쓰인다고 하는 군요 1 턴의 1/1,000인 1 milliturn도 쓴다고 합니다.
 
참고자료 (Creative Commons Attribution-ShareAlike License)
http://en.wikipedia.org/wiki/Degree_%28angle%29
http://en.wikipedia.org/wiki/Radian
http://en.wikipedia.org/wiki/Grad_%28angle%29
http://en.wikipedia.org/wiki/Turn_%28geometry%29
반응형

+ Recent posts