_대문 | 방명록 | 최근글 | 홈피소개 | 주인놈
FrontPage › HivePython

파이썬 프로그램을 짠다.
import sys
import string
from pykospacing import spacing

for line in sys.stdin:
    line = line.strip()
    pc_id, msg = line.split("\t")
    print ("\t".join([pc_id, spacing(msg)]))

hdfs에 넣는다.
hadoop fs -put -f /home/hdfs/py/chat_spacing.py /user/hive/udfs

transform 함수를 써서 사용한다.
set hive.execution.engine=mr;
add file hdfs:///user/hive/udfs/chat_spacing.py;

select transform(msg) using 'python3.4 chat_spacing.py' as (pc_id bigint, msg string)
from (
    select concat(cast(id as string), "\t", sss) msg
    from sample
) t;


pyhive #

from pyhive import hive
conn = hive.Connection(host="192.168.0.100", port=10000, username="hdfs")
 
cursor = conn.cursor()
cursor.execute("SHOW TABLES")
for table in cursor.fetchall():
    print(table)

export http_proxy='http://xxx.com'
export https_proxy='https://xxx.com'

pip3.4 install pip3.4 install tensorflow --trusted-host pypi.python.org --index-url=https://pypi.python.org/simple/

댓글 남기기..
이름: : 오른쪽의 새로고침을 클릭해 주세요. 새로고침
EditText : Print : Mobile : FindPage : DeletePage : LikePages : Powered by MoniWiki : Last modified 2019-01-25 10:13:54

믿음은 기다리는 것이 아닐가 행동이다. 진정한 믿음을 가졌다면 지금 곧 행동하라.