Linguaggio assembly

di
Anonimizzato17943
il
27 risposte

Linguaggio assembly

Buonasera a tutti sto appena imparando il linguaggio assembly qualcuno mi potrebbe cortesemente spiegare a grandi linee le utilità e a cosa può servire questo linguaggio
Grazie mille per l attenzione
Buonaserata

27 Risposte

  • Re: Linguaggio assembly

    Su alcuni microcontrollori si può programmare solo in Assembly.
    Più che altro oggi lo si usa solo per ottimizzare alcuni frammenti di un programma.
    è d'obbligo conoscerlo perché aiuta a capire come funzionano i linguaggi di più alto livello tipo il c, infatti i linguaggi compilati vengono tradotti prima in Assembly e poi in linguaggio macchina.
  • Re: Linguaggio assembly

    Gioele Garzella ha scritto:


    Buonasera a tutti sto appena imparando il linguaggio assembly qualcuno mi potrebbe cortesemente spiegare a grandi linee le utilità e a cosa può servire questo linguaggio
    Grazie mille per l attenzione
    Buonaserata
    come ti hanno giá detto, lo studio dell'assembly ti puó aiutare a comprendere come funzionano le cose all'interno del calcolatore.

    Lavorativamente parlando non penso proprio avrai modo di usarlo
  • Re: Linguaggio assembly

    Primo argomento letto e ho già capito quello che stavo cercando di capire da anni. . Spero faremo presto amicizia.
    Sto tentando di penetrare i segreti di Java. Buona giornata a tutti.
    Ciao Luca
  • Re: Linguaggio assembly

    E che c'entra questo tuo post in questo thread?

    Sai come funziona un forum?
  • Re: Linguaggio assembly

    Sì scusate, ero ansioso di presentarmi, comunque mi è più chiaro quale sia il linguaggio più vicino alla macchina che si possa usare e cosa devo imparare per riuscire a comunicare con certe macchine. Forse non era lo scopo della discussione ma un problema me l'ha risolto. Ciao
  • Re: Linguaggio assembly

    Io rinnoverei la domanda, rendendola più personale.
    La mia domanda è:
    Linguaggio Assembly, ma quale?
    Sono diversi per ogni architettura, quindi diversi per ogni familgia di processori, intel, amd, e tutti gli altri.
    Io ne ho trovati due. 8086 e MIPS e magari ce ne sono di altri.
    Ho capito questo, e correggetemi se sbaglio, 8086 è adotatto per i processori Intel, ma solo per questi?
    Io voglio "sporcarmi le mani", con un pò di assembly, ma non so quale studiare
    Ho letto le prime pagine di uno intel8086 e mi è sembrato semplice.
    Ricordo che ha tipo...sparo 14,16 registri.
    EAX, EBX...
    mentre il mips l'ho letto poco fa, sempre le prime pagine e dice.... 32 registri $1-->$32 o $31?ahahah
    Potrei provare tra 2 strade:
    1)Intel 8086, perchè i processori intel, sono i migliori (controllo dopo se ho detto una boiata)
    2)MIPS... Il tizio che ha scritto questo "tutorial", usa un modo molto più scorrevole
    Il tizio che ha scritto il testo intel 8086, invece più palloso ma più dettagliato.
    A conti fatti la scelta ricade su Intel 8086.
    Volevo chiedervi un parere, ma forse ho trovato la risposta .
    Ormai l'ho scritta.
    Condividiamo
  • Re: Linguaggio assembly

    La tua domanda e' incompleta: fa il paio con una macchina a benzina la riempio con la benzina o con il gasolio?!

    Prima distinzione:

    CPU di marche diverse hanno set di istruzioni diversi, quindi useranno assembler diversi

    Quindi: Intel, ARM, IBM PowerPC, Motorola, MIPS, sono marche diverse!

    Ok, ora ogni marca POTREBBE avere diverse tipologie di CPU, che potrebbero usare set TOTALMENTE diversi di istruzioni. Al momento non ti saprei fare un esempio, ma non lo posso escludere a priori.

    Quello che so e' che ogni marca ha diverse generazioni di CPU, che usano un set di istruzioni che, di generazione in generazione, viene aumentotao (MAI RIDOTTO).

    Questo e' valido per

    Motorola: 68000, 68010, 68020, 68030, 68040 ...
    Intel: 8080, 8086/8088, 80186, 80286, 80386, 80486, Pentium,.... Xeon, Core ...
    IBM PowerPC: ...
    ARM: ...

    Questo implica che il set di istruzioni di un processore e' presente anche nei processori delle generazioni successive.

    Ci potrebbero essere linee di processori parallele in cui sono presenti istruzioni assembler in una linea ma non nell'altra. Penso ai processori Xeon (per server) e Core (per consumer). Ma sono talmente specifiche che per chi e' alle prime esperienze la cosa e' abbondantemente trascurabile.

    Per poter programmare in assembler, ti serve un hardware da programmare:

    potrebbe essere il PC (Mac, Linux, Windows poco importa perche' attualmente tutti usano CPU Intel), Arduino, le schedine Intel Galileo, Intel Edison, Adapteva parallela, ...

    Ed un ambiente di sviluppo specifico per quell'hardware.

    Ora, rimanendo in ambito Intel/PC, di ambienti di sviluppo per assembler ne esistono ma non li ho mai usati.

    Invece quello che mi e' capitato di fare e' aggiungere pezzetti in assembler in programmi C/C++.

    A mio avviso, questa e' la soluzione piu' semplice per chi deve iniziare: ha a disposzione IDE, tool, librerie per fare quello che vuole, ed in piu' puo' divertirsi con piccoli pezzetti in assembler.

    Scrivere un programma completo in assembler e' decisamente complicato, se si esce dal semplice "Hello World".

    Ora, qui nasce in PICCOLO problema: ci sono DUE possibili sintassi per le istruzioni assembler, che dipendono dall'assemblatore:

    - la versione intel (usata anche nella sua documentazione), che segue la sitassi dell'assegnamento:

    <istruzione_assembler> <locazione_risultato> <operando1> ...

    - la versione Motorla:

    <istruzione_assembler> <operando1> ... <locazione_risultato>

    Ho trovato questa situazione nell'assemblatore GNU ('as', comunque e' possibile specificare quale sintassi si vuole usare).

    Il compilatore GNU C/C++ supporta l'inserimento di istruzioni asembler direttamente nel codice C/C++.

    Anche Visual Studio dovrebbe supportare l'utilizzo dell'assembler inline, ma da qualche parte ho letto che la cosa e' fattibile SOLO a 32 bit e non a 64. Nel caso, dovrai approfondire.

    I compilatori attuali sono decisamente intelligenti: riescono a generare del codice molto ben ottimizzato. Spesso, inoltre, il compilatore mette a disposizone una grande quantita' di direttive che permettono di ottimizzare ulteriormente il codice generato.
  • Re: Linguaggio assembly

    Ciao Migliorabile, grazie per la risposta.
    Non sapevo che di generazione in generazione, il linguaggio assembly venisse contemporaneamente aggiornato, per le nuove tecnologie di processori.
    Sono aggiornamenti di librerie immagino.
    Mi è sembrato di capire che assembly disponga anche di funzioni, quindi penso ci siano anche delle librerie.
    Magari ho detto na cosa sbagliata, librerie in assembly...
    E' un linguaggio a basso livello, non mi spiego la presenza di librerie...oppure ci sono nuovi registri? vabbè lo scoprirò con la pratica.
    Non voglio scrivere programmi in assembly (è purò masochismo)
    La mia intenzione è comprendere meglio la macchina, il suo funzionamento, per poterci interagire meglio.
    Magari tentare piccoli programmi in assembly, tipo una calcolatrice, lavorare un pò con le stringhe, solo per una migliore comprensione.
    Mi trovo su 3 fronti:

    Rete
    Java
    Assembly

    e per divertirmi
    Unity 3d...(Al momento posso solo impare l'IDE ci sta di mezzo java, javascript che ancora non conosco del tutto. di JavaScript praticamente zero )
    Penso che cmq imparato Java il passaggio a java script è facile, anche se gli script fanno parte dei linguaggi interpretati. Dico bene?

    Mi devo sempre rileggere ste cose...ogni volta è una confusione, fino a quando non ci metto mani sopra.

    Cmq volendo provare un pò di assembly, sono indeciso tra 8086 oppure l'ultima versione dei processore i core...
    Tanto vale vedersi uno aggiornato.
    Buon Appetito!!!!
  • Re: Linguaggio assembly

    Manuali Intel sull'assembler dei processori dall'8086 a quelli di ultima generazione

    http://www.intel.com/content/www/us/en/processors/architectures-software-developer-manuals.html

    Questo e' un esempio di programma in C++ con dei pezzi in assembler.
    Le parti in assembler al momento sono commentate perche' mi serviva solo per fare dei test.

    Per compilarlo serve un compilatore GNU C/C++, quindi funziona sotto Windows+Cygwin, Linux a Mac.


    Se non capisci che cosa fa, non preoccuparti: guarda solo la parte __asm__.

    
    /* 
     * File:   float4.hpp
     * Author: 
     *
     * Created on May 12, 2015, 7:28 PM
     */
    
    /*
     * XMM0 .. XMM15: 128bit registers
     * MXCRS: 
     * 
     * 
     * SSE
     * -----------------------------------------------------------------
     * SSE data type: float[4]
     * 
     * MOVAPS:  m->r, r->r, r->m aligned    float[4]
     * MOVUPS:  m->r, r->r, r->m unaligned  float[4]
     * MOVSS:   m->r, r->r, r->m            float[1]
     * MOVLPS:  m->r, r->m       low        float[2]
     * MOVHPS:  m->r, r->m       high       float[2]
     * MOVLHPS: r->r             low->high  float[2]
     * MOVHLPS: r->r             high->low  float[2]
     * MOVMSKPS:
     * 
     * ADDPS, SUBPS, MULPS, DIVPS, RCPPS, SQRTPS, RSQRTPS, MAXPS, MINPS, 
     * ADDSS, SUBSS, MULSS, DIVSS, RCPSS, SQRTSS, RSQRTSS, MAXSS, MINSS, 
     * 
     * SHUFPS, UNPCKHPS, UNPCKLPS
     * 
     * 
     * SSE2
     * -----------------------------------------------------------------
     * 
     * SSE3
     * -----------------------------------------------------------------
     * 
     * MOVSHDUP, MOVSLDUP
     * ADDSUBPS, HADDPS, HSUBPS
     * 
     * 
     * SSSE3
     * -----------------------------------------------------------------
     * 
     * 
     * SSE4.1
     * -----------------------------------------------------------------
     * 
     * DPPS
     * 
     * ROUNDPS
     * ROUNDSS
     * 
     * BLENDPS, BLENDVPS
     * 
     * INSERTPS, EXTRACTPS
     * 
     * 
     * SSE4.2
     * -----------------------------------------------------------------
     * 
     */
    
    #ifndef FLOAT4_HPP
    #define	FLOAT4_HPP
    
    #include <cmath>
    #include <string>
    #include <vector>
    #include <intrin.h>
    
    
    namespace hls {
        
        //typedef float __m128 __attribute__ ((__vector_size__ (16)));
        //typedef uint32_t __v4si __attribute__ ((__vector_size__ (16)));
    
        class float4;
        class float4x4;
        class float4v;
        
        
        // ======================================================================
        // float4
        // ======================================================================
        
        struct float4 {
        private:
            float4(const __m128& m): m128(m) { m128[3] = 0; }
    
            friend class float4x4;
        public:
            union {
                struct { float x,y,z,t; };
                struct { __m128 m128; };
            };
        public:
            // -- constructors
            
            float4() { }
            explicit float4(float s): x(s), y(s), z(s), t(0) { }
            float4(float x,float y,float z): x(x), y(y), z(z), t(0) { }
            float4(const float4& f): m128(f.m128) { }
            
            // -- accessors
            
            float  operator[](size_t i) const { return m128[i]; }
            float& operator[](size_t i)       { return m128[i]; }
            
            // -- assignments
            
            float4& operator =(const float4& f) {
                m128 = f.m128;
                //x = f.x;
                //y = f.y;
                //z = f.z;
                return *this;
            }
            
            float4& operator +=(const float4& f) {
                // 10.4 ns
                //x += f.x;
                //y += f.y;
                //z += f.z;
                
                // 4.8 ns
                m128 = _mm_add_ps(m128, f.m128);
    
                // 4.8 ns
                //__asm__ (
                //    "movaps %[a], %%xmm0;"
                //    "addps  %[b], %%xmm0;"
                //    "movaps %%xmm0, %[ret];"
                //    : [ret] "+m" (m128)
                //    : [a] "m" (m128), [b] "m" (f.m128)
                //);
                return *this;
            }
            
            float4& operator -=(const float4& f) {
                // 10.2 ns
                //x -= f.x;
                //y -= f.y;
                //z -= f.z;
    
                // 4.8 ns
                m128 = _mm_sub_ps(m128, f.m128);
    
                // 4.8 ns
                //__asm__ (
                //    "movaps %[a], %%xmm0;"
                //    "subps  %[b], %%xmm0;"
                //    "movaps %%xmm0, %[ret];"
                //    : [ret] "+m" (m128)
                //    : [a] "m" (m128), [b] "m" (f.m128)
                //);
                return *this;
            }
            
            float4& operator *=(float s) {
                // 8 ns
                //x *= s;
                //y *= s;
                //z *= s;
    
                // 8.2 ns
                m128 = _mm_mul_ps(m128, _mm_set1_ps(s));
    
                // 8.2 ns
                //__m128 s128 = (__m128){ s, s, s, 0 };
                //__asm__ (
                //    "movaps %[a], %%xmm0;"
                //    "mulps  %[b], %%xmm0;"
                //    "movaps %%xmm0, %[ret];"
                //    : [ret] "+m" (m128)
                //    : [a] "m" (m128), [b] "m" (s128)
                //);
                return *this;
            }
            
            // -- operators
            
            float4 operator +() const { return float4( x, y, z); }
            float4 operator -() const { return float4(-x,-y,-z); }
            
            float4 operator +(const float4& f) const {
                // 12.6 ns
                //return float4(x + f.x, y + f.y, z + f.z);
                
                // 11.1 ns
                __m128 r128 = _mm_add_ps(m128, f.m128);
                
                // 10.0 ns
                //__m128 r128;
                //__asm__ (
                //    "movaps %[a], %%xmm0;"
                //    "addps  %[b], %%xmm0;"
                //    "movaps %%xmm0, %[ret];"
                //    : [ret] "=m" (r128)
                //    : [a] "m" (m128), [b] "m" (f.m128)
                //);
                return r128;
            }
            
            float4 operator -(const float4& f) const {
                // 12.8 ns
                //return float4(x - f.x, y - f.y, z - f.z);
                
                // 11.6 ns
                __m128 r128 = _mm_sub_ps(m128, f.m128);
                
                // 10.1 ns
                //__m128 r128;
                //__asm__ (
                //    "movaps %[a], %%xmm0;"
                //    "subps  %[b], %%xmm0;"
                //    "movaps %%xmm0, %[ret];"
                //    : [ret] "=m" (r128)
                //    : [a]  "m" (m128), [b] "m" (f.m128)
                //);
                return r128;
            }
            
            float4 operator *(float s) const {
                // 11.8 ns
                //return float4(x*s, y*s, z*s);
                
                // 12.5 ns
                __m128 r128 = _mm_sub_ps(m128, _mm_set1_ps(s));
                
                // 11.5 ns
                //__m128 r128;
                //__m128 s128 = (__m128){ s, s, s, 0 };
                //__asm__ (
                //    "movaps %[a], %%xmm0;"
                //    "mulps  %[b], %%xmm0;"
                //    "movaps %%xmm0, %[ret];"
                //    : [ret] "+m" (r128)
                //    : [a] "m" (m128), [b] "m" (s128)
                //);            
                return r128;
            }
            
            // -- predicates
            
            bool zero() const;
            
            bool equal(const float4& f) const;
            
            bool operator ==(const float4& f) const { return equal(f); }
            
            // -- scalar functions
            
            float dot(const float4& f) const;
            
            float norm() const;
            
            // -- vectorial functions
            
            float4 cross(const float4& f) const;
            
            // -- ortho
            
            float4 ortho() const;
            float4 ortho(const float4& v) const;
            float4 ortho(const float4& u, const float4& v) const;
            
            // -- utilities
            
            std::string str() const;
            
        };
        
        inline float4 operator *(float s, const float4& f) {
            return f*s;
        }
        
        inline float abs(const float4& f) {
            return f.norm(); 
        }
        
        static float4 unit(const float4& f);
        
        // ======================================================================
        // float4v
        // ======================================================================
        
        class float4v {
            std::vector<float4> data;
        public:
            float4v() { }
            
            //float4v(float4v&& v): data(v.data) { }
            float4v(const float4v& v): data(v.data) { }
            
            float4  at(size_t i) const { return data.at(i); }
            float4& at(size_t i)       { return data.at(i); }
            
            float4  operator[](size_t i) const { return data[i]; }
            float4& operator[](size_t i)       { return data[i]; }
            
            float4v& add(const float4& f) {
                data.push_back(f);
                return *this;
            }
            
            size_t size() const { return data.size(); }
        };
        
        // ======================================================================
        // f4
        // ======================================================================
        
        struct f4 {
            static float4 origin;
            static float4 x_axis;
            static float4 y_axis;
            static float4 z_axis;
            static float4 neg_x_axis;
            static float4 neg_y_axis;
            static float4 neg_z_axis;
        };
        
        // ======================================================================
        // float4x4
        // ======================================================================
        
        typedef float __v512 __attribute__ ((__vector_size__ (64), __may_alias__));
        
        class float4x4 {
            union {
                struct { float m[4][4]; };
                struct { __m128 t128[4]; };
                struct { __v512 v512; };
            };
            
            struct transposed { };
            
            float4x4(const float4x4& t, transposed);
        public:
            float4x4();
            float4x4(const float4x4& t): v512(t.v512) { }
            
            float4x4(const float* t);
            
            // -- constructors
            
            float4x4& zero();
            float4x4& identity();
            float4x4& translation(float x, float y, float z);
            float4x4& rotation(float x, float y, float z, float c, float s);
            
            
            float4x4& translation(const float4& t) {
                return translation(t.x, t.y, t.z);
            }
            
            float4x4& rotation(float x, float y, float z, float a, bool deg) {
                a = deg ? a*0.017453292519943295f : a;
                return rotation(x, y, z, cosf(a), sinf(a));
            }
    
            float4x4& rotation(const float4& v, float a, bool deg) {
                a = deg ? a*0.017453292519943295f : a;
                return rotation(v.x, v.y, v.z, cosf(a), sinf(a));
            }
    
            float4x4& rotation(const float4& v, float c, float s) {
                return rotation(v.x, v.y, v.z, c, s);
            }
    
            // -- accesors
            
            inline float  at(size_t i, size_t j) const { return m[i][j]; }
            inline float& at(size_t i, size_t j)       { return m[i][j]; }
            
            // -- matrix composition
            
            float4x4& translate(float x, float y, float z);
            
            float4x4& rotate(float x, float y, float z, float c, float s);
            
            
            float4x4& translate(const float4& t) {
                return translate(t.x, t.y, t.z);
            }
    
            float4x4& rotate(float x, float y, float z, float a, bool deg) {
                a = deg ? a*0.017453292519943295f : a;
                return rotate(x, y, z, cosf(a), sinf(a));
            }
    
            float4x4& rotate(const float4& v, float a, bool deg) {
                a = deg ? a*0.017453292519943295f : a;
                return rotate(v.x, v.y, v.z, cosf(a), sinf(a));
            }
    
            float4x4& rotate(const float4& v, float c, float s) {
                return rotate(v.x, v.y, v.z, c, s);
            }
            
            // -- matrix operations
            
            float4x4 transpose() const;
            float4x4 dot(const float4x4& t) const;
            
            // -- vector operations
            
            float4  apply( const float4&  f) const;
            float4  rotate(const float4&  f) const;
            
            float4v apply( const float4v& f) const;
            
            // -- utilities
            
            std::string str() const;
            
        };
        
    }
    
    #endif	/* FLOAT4_HPP */
    
    
    
    
    #include <stdio.h>
    #include <cstring>
    #include "float4.hpp"
    
    using namespace hls;
    
    
    #define _asm_ __asm__ volatile
    
    // ==========================================================================
    // Support
    // ==========================================================================
    
    static float eps = 1.0e-5;
    
    static inline bool isz(float x) { return x < 0 ? x >= -eps : x <= +eps; }
    static inline bool iseq(float x, float y) { return isz(x-y); }
    static inline float sqf(float x) { return x*x; }
    
    
    // ==========================================================================
    // Constants
    // ==========================================================================
    
    float4 f4::origin(0,0,0);
    
    float4 f4::x_axis(1,0,0);
    float4 f4::y_axis(0,1,0);
    float4 f4::z_axis(0,0,1);
    
    float4 f4::neg_x_axis(-1,0,0);
    float4 f4::neg_y_axis(0,-1,0);
    float4 f4::neg_z_axis(0,0,-1);
    
    
    // ==========================================================================
    // SSE implementations
    // ==========================================================================
    
    //static float sqrtps(const float x) {
    //    float ret = 0;
    //    _asm_ (
    //        "movaps %[x],   %%xmm0;"
    //        "sqrtss %%xmm0, %%xmm0;"
    //        "movss  %%xmm0, %[ret];"
    //        : [ret] "=m" (ret)
    //        : [x] "m" (x)
    //    );
    //    return ret;
    //}
    
    static float dotps(const __m128& a, const __m128& b, bool squared=false) {
       
        // 4.7 ns -O1
        __m128 t128 = _mm_mul_ps(a, b);
        t128 = _mm_add_ps(t128, _mm_shuffle_ps(t128, t128, _MM_SHUFFLE(3,3,3,2)));
        t128 = _mm_add_ss(t128, _mm_shuffle_ps(t128, t128, _MM_SHUFFLE(3,3,3,1)));
        if (squared)
            t128 = _mm_sqrt_ss(t128);
        return t128[0];
        
        // 7.9 ns
    //    float ret = 0;
    //    _asm_ (
    //        "movaps %[a],   %%xmm0;"
    //        "mulps  %[b],   %%xmm0;"
    //        "movaps %%xmm0, %%xmm1;"
    //        "shufps $0xFE,  %%xmm1, %%xmm1;"        // 3 3 3 2
    //        "addps  %%xmm1, %%xmm0;"
    //        "movaps %%xmm0, %%xmm1;"
    //        "shufps $0xF9,  %%xmm1, %%xmm1;"        // 3 3 3 1
    //        "addps  %%xmm1, %%xmm0;"
    //        //"movss  %%xmm0, %[ret];"
    //        : [ret] "=m" (ret)
    //        :   [a]  "m" (a), [b] "m" (b)
    //    );
    //        
    //    if (!squared) 
    //    {
    //        _asm_ (
    //            "movss  %%xmm0, %[ret];"
    //            : [ret] "=m" (ret)
    //        );
    //    }
    //    else 
    //    {
    //        _asm_ (
    //            "sqrtss %%xmm0, %%xmm0;"
    //            "movss  %%xmm0, %[ret];"
    //            : [ret] "=m" (ret)
    //        );
    //    }
    //    return ret;
    }
    
    //static float normps(const __m128& a) {
    //    float ret = 0;
    //    __asm__ (
    //        "movaps %[a],   %%xmm0;"
    //        "mulps  %%xmm0, %%xmm0;"
    //        "movaps %%xmm0, %%xmm1;"
    //        "shufps $0xFE,  %%xmm1, %%xmm1;"        // 3 3 3 2
    //        "addps  %%xmm1, %%xmm0;"
    //        "movaps %%xmm0, %%xmm1;"
    //        "shufps $0xF9,  %%xmm1, %%xmm1;"        // 3 3 3 1
    //        "addps  %%xmm1, %%xmm0;"
    //        "sqrtss %%xmm0, %%xmm0;"
    //        "movss  %%xmm0, %[ret];"
    //        : [ret] "=m" (ret)
    //        :   [a]  "m" (a)
    //    );
    //    return ret;
    //}
    
    static __m128 epsps = (__m128){ eps, eps, eps, eps};
    static __m128 signps =(__m128)(__v4si){ 0x80000000, 0x80000000, 0x80000000, 0x80000000 };
    
    
    //__m128 hls::absps(const __m128& a) {
    //    __m128 ret;
    //    __asm__ (
    //        "movaps %[a],    %%xmm2;"
    //        "movaps %[sign], %%xmm0;"
    //        "andnps %%xmm2,  %%xmm0;"
    //        "movaps %%xmm0,  %[ret]"
    //        : [ret] "=m" (ret)
    //        :   [a]  "m" (a), [sign] "m" (signps), [eps] "m" (epsps)
    //    );
    //    return ret;
    //}
    
    //bool iszps(const __m128& a) {
    //    __m128 ret;
    //    _asm_ (
    //        // clear bit r[31]
    //        "movaps %[sign], %%xmm0;"
    //        "andnps %[a],    %%xmm0;"
    //    
    //        // check if eps < r  (opposite of 'r <= eps' to have AL zero if true)
    //        "movaps %[eps],  %%xmm1;"
    //        "cmpps  $1, %%xmm0, %%xmm1;"
    //        "movaps %%xmm1, %[ret]"
    //        : [ret] "=m" (ret)
    //        :   [a]  "m" (a), 
    //         [sign] "m" (signps), [eps] "m" (epsps)
    //    );
    //    return !(ret[0] || ret[1] || ret[2] || ret[3]);
    //}
    
    //bool iseqps(const __m128& a, const __m128& b) {
    //    __m128 ret;
    //    _asm_ (
    //        "movaps %[sign], %%xmm0;"
    //
    //        // r = a - b
    //        "movaps %[a],    %%xmm1;"
    //        "subps  %[b],    %%xmm1;"
    //    
    //        // clear bit r[31]
    //        "andnps %%xmm1,  %%xmm0;"
    //    
    //        // check if eps < r  (opposite of 'r <= eps' to have AL zero if true)
    //        "movaps %[eps],  %%xmm1;"
    //        "cmpps  $1, %%xmm0, %%xmm1;"
    //        "movaps %%xmm1, %[ret]"
    //        : [ret] "=m" (ret)
    //        :   [a] "m" (a), [b] "m" (b), 
    //         [sign] "m" (signps), [eps] "m" (epsps)
    //    );
    //    return !(ret[0] || ret[1] || ret[2] || ret[3]);
    //}
    
    
    // ==========================================================================
    // float4
    // ==========================================================================
    
    // -- predicates
    
    bool float4::zero() const {
        // 5.5 ns
        //return isz(x) && isz(y) && isz(z);
        
        // 9.9 ns
        __m128 c128 = _mm_cmple_ps(epsps, _mm_andnot_ps(signps, m128));
        return !(c128[0] || c128[1] || c128[2]);
        
        // 5.1 ns
        //return iszps(m128);
    }
    
    bool float4::equal(const float4& f) const {
        // 19.8 ns
        //return iseq(x, f.x) && iseq(y, f.y) && iseq(z, f.z);
    
        // 10.5 ns
        __m128 c128 = _mm_cmple_ps(epsps, _mm_andnot_ps(signps, _mm_sub_ps(m128, f.m128)));
        return !(c128[0] || c128[1] || c128[2]);
        
        // 11.5 ns
        //return iseqps(m128, f.m128);
    }
    
    // -- scalar
    
    float float4::dot(const float4& f) const {
        // 5.1 ns
        //return x*f.x + y*f.y + z*f.z;
        
        // 10.7 ns
        //__m128 t128 = _mm_mul_ps(m128, f.m128);
        //t128 = _mm_add_ps(t128, _mm_shuffle_ps(t128, t128, _MM_SHUFFLE(3,3,3,2)));
        //t128 = _mm_add_ss(t128, _mm_shuffle_ps(t128, t128, _MM_SHUFFLE(3,3,3,1)));
        //return t128[0];
        
        // 7.2 ns (asm))
        return dotps(m128, f.m128);
        
        // 5.1 ns
        //float ret;
        //__asm__ (
        //    "movaps %[a],   %%xmm0;"
        //    "mulps  %[b],   %%xmm0;"
        //    "movaps %%xmm0, %%xmm1;"
        //    "shufps $0xFE,  %%xmm1, %%xmm1;"        // 3 3 3 2
        //    "addps  %%xmm1, %%xmm0;"
        //    "movaps %%xmm0, %%xmm1;"
        //    "shufps $0xF9,  %%xmm0, %%xmm1;"        // 3 3 3 1
        //    "addps  %%xmm1, %%xmm0;"
        //    "movss  %%xmm0, %[ret];"
        //    : [ret] "=m" (ret)
        //    : [a] "m" (m128), [b] "m" (f.m128)
        //);
        //return ret;
    }
    
    float float4::norm() const {
        // 41.7 ns
        //return sqrtf(sqf(x) + sqf(y) + sqf(z));
        
        // 38.8 ns, dot/asm
        //return sqrtf(dot(*this));
        
        // 39.2 ns  -O0
        // 5.4 ns   -O1
        return sqrtf(dotps(m128, m128));
    
        // 18.6 ns
        //return sqrtps(dotps(m128, m128));
        
        // 8.2 ns
        //return dotps(m128, m128, true);
        
        // 5.1 ns
        //float ret;
        //__asm__ (
        //    "movaps %[a],   %%xmm0;"
        //    "mulps  %%xmm0, %%xmm0;"
        //    "movaps %%xmm0, %%xmm1;"
        //    "shufps $0x1E,  %%xmm1, %%xmm1;"        // 0 1 2 3
        //    "addps  %%xmm1, %%xmm0;"
        //    "movaps %%xmm0, %%xmm1;"
        //    "shufps $0x39,  %%xmm0, %%xmm1;"        // 0 3 2 1
        //    "addps  %%xmm1, %%xmm0;"
        //    "sqrtss %%xmm0, %%xmm0;"
        //    "movss  %%xmm0, %[ret];"
        //    : [ret] "=m" (ret)
        //    : [a] "m" (m128)
        //);
        //return ret;
    }
    
    // -- vector
    
    float4 hls::unit(const float4& f) {
        float m = f.norm();
        return f*(isz(m) ? 0.f : (1/m));
    }
    
    
    float4 float4::cross(const float4& f) const {
        // y1*z2  z1*x2  x1*y2
        // z1*y2  x1*z2  y1*x2  
        
        // 11.8 ns
        //return float4(
        //        y*f.z - z*f.y,
        //        z*f.x - x*f.z,
        //        x*f.y - y*f.x);
        
        // 11.8 ns
        return _mm_sub_ps(
            _mm_mul_ps(_mm_shuffle_ps(m128, m128, _MM_SHUFFLE(3, 0, 2, 1)), _mm_shuffle_ps(f.m128, f.m128, _MM_SHUFFLE(3, 1, 0, 2))), 
            _mm_mul_ps(_mm_shuffle_ps(m128, m128, _MM_SHUFFLE(3, 1, 0, 2)), _mm_shuffle_ps(f.m128, f.m128, _MM_SHUFFLE(3, 0, 2, 1)))
        );
        
        // 7.6 ns
        //__m128 r128;
        //__asm__ (
        //    "movaps %[a], %%xmm3;"              //  3  2  1  0
        //    "movaps %[b], %%xmm4;"
        //
        //    "movaps %%xmm3, %%xmm0;"
        //    "movaps %%xmm4, %%xmm1;"
        //    "shufps $0xC9,  %%xmm0, %%xmm0;"    // t1 x1 z1 y1
        //    "shufps $0xD2,  %%xmm1, %%xmm1;"    // t2 y2 x2 z2
        //    "mulps  %%xmm1, %%xmm0;"
        //
        //    "movaps %%xmm3, %%xmm1;"
        //    "movaps %%xmm4, %%xmm2;"
        //    "shufps $0xD2,  %%xmm1, %%xmm1;"    // t1 y1 x1 z1
        //    "shufps $0xC9,  %%xmm2, %%xmm2;"    // t2 x2 z2 y2   
        //    "mulps  %%xmm2, %%xmm1;"
        //
        //    "subps  %%xmm1, %%xmm0;"
        //    "movaps %%xmm0, %[ret];"
        //    : [ret] "=m" (r128)
        //    : [a] "m" (m128), [b] "m" (f.m128)
        //);
        //return r128;
    }
    
            
    float4 float4::ortho() const {
        return unit(*this);
    }
    
    float4 float4::ortho(const float4& v) const {
        float4 t(*this);
        t -= t.dot(v)*v;
        return unit(t);
    }
    
    float4 float4::ortho(const float4& u, const float4& v) const {
        float4 t(*this);
        t -= t.dot(u)*u;
        t -= t.dot(v)*v;
        return unit(t);
    }
    
    // -- str
    
    std::string float4::str() const {
        char buf[64];
        sprintf(buf, "[%f, %f, %f]", x, y, z);
        //sprintf(buf, "[%f, %f, %f]", m128[0], m128[1], m128[2]);
        return buf;
    }
    
    // ==========================================================================
    // float4x4
    // ==========================================================================
    
    // -- matrix constructors
    
    float4x4::float4x4() {
        identity();
    }
    
    float4x4::float4x4(const float* t) {
        size_t i,j,k=0;
        for(i=0; i<4; ++i)
            for(j=0; j<4; ++j,++k)
                m[i][j] = t[k];
    }
    
    float4x4::float4x4(const float4x4& t, transposed tr) {
        size_t i,j,k=0;
        for(i=0; i<4; ++i)
            for(j=0; j<4; ++j,++k)
                at(j,i) = t.at(i,j);
    }
    
    
    
    float4x4& float4x4::zero() {
        memset(&v512, 0, sizeof(v512));
        return *this;
    }
    
    float4x4& float4x4::identity() {
        memset(&v512, 0, sizeof(v512));
        at(0,0) = at(1,1) = at(2,2) = at(3,3) = 1;
        return *this;
    }
    
    float4x4& float4x4::translation(float x, float y, float z) {
        identity();
        at(0,3) = x;
        at(1,3) = y;
        at(2,3) = z;
        return *this;
    }
    
    float4x4& float4x4::rotation(float x, float y, float z, float c, float s) {
        float m = sqrtf(sqf(x) + sqf(y) + sqf(z));
        float q = sqrtf(sqf(c) + sqf(s));
    
        identity();
    
        if (isz(m) || isz(q)) 
            return *this;
    
        // normalize (x,y,z) and (c,s)
        {
            m = 1/m;
            x *= m;
            y *= m;
            z *= m;
    
            q = 1/q;
            c *= q;
            s *= q;
        }
    
        if (iseq(c,1))
        {
            /* none */
        }
        else if (iseq(c, -1))
        {
            if (iseq(z, 1))
            {
                at(0,0) = -1;
                at(2,2) = -1;
            }
            else if (iseq(z, -1))
            {
                at(0,0) = -1;
                at(2,2) = -1;
            }
            else
            {
                float x2 = sqf(x);
                float y2 = sqf(y);
                float z2 = sqf(z);
                float xy = x*y;
                float s = 1/(1 - z2);
    
                at(0,0) = -(x2 - y2)*s;
                at(0,1) = -2*x*y*s;
                at(1,0) = -2*x*y*s;
                at(1,1) = (x2 - y2)*s;
                at(2,2) = -(1 - z2);
            }
        }
        else if (iseq(x, 1))
        {
            at(1,1) =  c;
            at(1,2) = -s;
            at(2,1) =  s;
            at(2,2) =  c;
        }
        else if (iseq(x,-1))
        {
            at(1,1) =  c;
            at(1,2) =  s;
            at(2,1) = -s;
            at(2,2) =  c;
        }
        else if (iseq(y, 1))
        {
            at(0,0) =  c;
            at(0,2) =  s;
            at(2,0) = -s;
            at(2,2) =  c;
        }
        else if (iseq(y,-1))
        {
            at(0,0) =  c;
            at(0,2) = -s;
            at(2,0) =  s;
            at(2,2) =  c;
        }
        else if (iseq(z, 1))
        {
            at(0,0) =  c;
            at(0,1) = -s;
            at(1,0) =  s;
            at(1,1) =  c;
        }
        else if (iseq(z,-1))
        {
            at(0,0) =  c;
            at(0,1) =  s;
            at(1,0) = -s;
            at(1,1) =  c;
        }
        else
        {
            float x2 = sqf(x);
            float y2 = sqf(y);
            float z2 = sqf(z);
            float xy = x*y;
            float yz = y*z;
            float xz = x*z;
    
            at(0,0) = c + x2*(1 - c);
            at(0,1) = xy*(1 - c) - z*s;
            at(0,2) = xz*(1 - c) + y*s;
    
            at(1,0) = xy*(1 - c) + z*s;
            at(1,1) = c + y2*(1 - c);
            at(1,2) = yz*(1 - c) - x*s;
    
            at(2,0) = xz*(1 - c) - y*s;
            at(2,1) = yz*(1 - c) + x*s;
            at(2,2) = c + z2*(1 - c);
        }
    
        return *this;
    }
    
    // -- matrix composition
    
    float4x4& float4x4::translate(float x, float y, float z) {
        float4x4 t(float4x4().translation(x, y, z));
        v512 = t.dot(*this).v512;
        return *this;
    }
    
    float4x4& float4x4::rotate(float x, float y, float z, float c, float s) {
        float4x4 r(float4x4().rotation(x, y, z, c, s));
        v512 = r.dot(*this).v512;
        return *this;
    }
    
    
    // -- matrix operations
    
    float4x4 float4x4::transpose() const {
        float4x4 r;
        size_t i, j;
        
        for(i=0; i<4; ++i)
        for(j=0;j<4; ++j)
            r.at(j,i) = at(i,j);
        
        return r;
    }
    
    float4x4 float4x4::dot(const float4x4& m) const {
        
        float4x4 r;
        size_t i, j, k;
        
        // 665.436 ns
        //float s;
        //for(i=0; i<4; ++i)
        //for(j=0; j<4; ++j) {
        //    s = 0;
        //    for(k=0; k<4; ++k)
        //        s += at(i,k)*m.at(k,j);
        //    r.at(i,j) = s;
        //}
    
        // 326.1 ns
        //float4x4 t(m, transposed());
        //for(i=0; i<4; ++i)
        //for(j=0; j<4; j++) {
        //    r.at(i,j) = dotps(t128[i], t.t128[j]);;
        //}
        
        // 287.8 ns
        float4x4 t(m, transposed());
        for(i=0; i<4; ++i)
        {
            r.at(i,0) = dotps(t128[i], t.t128[0]);
            r.at(i,1) = dotps(t128[i], t.t128[1]);
            r.at(i,2) = dotps(t128[i], t.t128[2]);
            r.at(i,3) = dotps(t128[i], t.t128[3]);
        }
        
        return r;
    }
    
    float4 float4x4::apply(const float4& f) const {
        __m128 r128;
    
        // 45.5 ns
        //r128[0] = at(0,0)*f.x + at(0,1)*f.y + at(0,2)*f.z + at(0,3);
        //r128[1] = at(1,0)*f.x + at(1,1)*f.y + at(1,2)*f.z + at(1,3);
        //r128[2] = at(2,0)*f.x + at(2,1)*f.y + at(2,2)*f.z + at(2,3);
        //r128[3] = 0;
    
        // 32.5 ns
        r128[0] = dotps(t128[0], f.m128) + at(0,3);
        r128[1] = dotps(t128[1], f.m128) + at(1,3);
        r128[2] = dotps(t128[2], f.m128) + at(2,3);
        r128[3] = 0;
    
        return r128;
    }
         
            
    
    float4 float4x4::rotate(const float4& f) const {
        __m128 r128;
        
    //    r128[0] = at(0,0)*f.x + at(0,1)*f.y + at(0,2)*f.z;
    //    r128[1] = at(1,0)*f.x + at(1,1)*f.y + at(1,2)*f.z;
    //    r128[2] = at(2,0)*f.x + at(2,1)*f.y + at(2,2)*f.z;
    //    r128[3] = 0;
    
        r128[0] = dotps(t128[0], f.m128);
        r128[1] = dotps(t128[1], f.m128);
        r128[2] = dotps(t128[2], f.m128);
        r128[3] = 0;
        
        return r128;
    }
    
    float4v float4x4::apply(const float4v& v) const {
        float4v rv(v);
        size_t i, n = v.size();
        
        for(size_t i=0; i<n; ++i)
            rv[i] = apply(v[i]);
        
        return rv;
    }
       
    // -- str
    
    std::string float4x4::str() const {
        char buf[512];
        sprintf(
            buf, 
            "[[%f, %f, %f, %f] \n"
            " [%f, %f, %f, %f] \n"
            " [%f, %f, %f, %f] \n"
            " [%f, %f, %f, %f]]\n", 
            at(0,0), at(0,1), at(0,2), at(0,3),
            at(1,0), at(1,1), at(1,2), at(1,3),
            at(2,0), at(2,1), at(2,2), at(2,3),
            at(3,0), at(3,1), at(3,2), at(3,3)
        );
        return buf;
    }
    
  • Re: Linguaggio assembly

    potrebbe essere il PC (Mac, Linux, Windows poco importa perche' attualmente tutti usano CPU Intel)
    tranne vbextreme che usa GNU/Linux con ARM.
    Ma lo stesso Windows gira su ARM(anche se ancora immaturo).
    Il Mac usava il PowerPc...
    Arduino usa Avr,ARM,Intel...

    Se volessi imparare l'assembly inizierei proprio da microcontrollori tipo il 328p o un Picmicro a 8bit.
    Quelli sui PC sono troppo complessi.
  • Re: Linguaggio assembly

    Io ne possiedo uno di microcontrollore, Arduino Uno R3, con tanto di led e sensori.
    Sarebbe forse più comodo programmarlo in Assembly ora che mi ci fai pensare.
    Non ne ho uno originale Arduino, quindi non so che tipo di processore è installato sulla scheda.
    Immagino però che sia proprio un ATmega, ma non so a quanti bit.
    Sono cose a cui non ci ho mai pensato fino ad ora...
    Ci sono 16 Din, Pin?...credo 16 Bit..
    Devo controllare.....

    .Migliorabile mi ha fatto notare che assembly viene cmq aggiornata, con l'uscita di nuovi processori(cosa che non sapevo)
    .Io ho pensato di partire dall'ultima versione di Assembly intel8086, perchè meglio essere aggiornati.
    .Tu mi consigli di cominciare proprio con qualcosa di meno complesso.(mi viene in mente Arduino)

    Sarebbe magari anche comodo, per la mia formazione.
    Mi spiego meglio, sto diventando vecchio e non ho un lavoro.
    Cosi mi sono messo nel 2014 a studiare programmazione.
    Ho imparato le basi dell'informatica grazie al C, ho fatto un programmino che facesse sputare sestine per il superEnalotto. E mi sono ingeniato su quello.
    Questa devo dirla, prima me ne vergognavo, ma mi sono ingegnato un metodo per "prevedere il futuro".
    E funzionava, su 5000 sestine realizzatte beccavo tantissimi 3, diversi 4 e al max due 5.
    Ma mai un 6.
    Come facevo...Semplice gli facevo elaborare i dati su tutti gli N-1 Concorsi, anche N-5 Concorsi.
    Dopodichè confronavo le sestine elaborate con quelle escluse e mi diceva quanti 3,4,5,6 venivano fuori. Quelle escluse ovvio che erano sempre gli ultimi concorsi.
    Ovvio anche che i numeri che mi sputava fuori, venivano secondo un mio criterio personale, ed erano anche impostabili.
    Carino eh
    Perchè questo? per mettermi alla prova e poi ci ricavavo qualche soldo non di vincite sfortunatamente.

    Mi sono perso n'altra volta sul personale.

    Morale della favola...
    Con Java spero in uno straccio di lavoro.
    Con Assembly voglio entrare nel paese delle meraviglie.
    E questo mi fa stare bene
  • Re: Linguaggio assembly

    ATTENZIONE: continui a parlare di libreria, e non capisco perche'!

    Le istruzioni assembler SONO CABLATE IN HARDWARE all'interno della CPU: sono il SUO set di istruzioni. NON SONO un qualcosa che scarichi da Internet!

    Per cabiare set di istruzioni, DEVI sostituire la CPU!
    Non esistono AGGIORNAMENTI software!

    Da un certo punto di vista sono funzioni di libreria, visto che anche le istruzioni assembler sono dei piccoli programmini scritti con un linguaggio di programmazione a bassissimo livello (ad esempio Verilog). Ma SOLO da un certo punto di vista

    Per quanto riguarda se studiare l'assembler di una CPU degli anni '80 o del 2015 (sto parlando di CPU Intel!), per quel che ti riguarda non c'e' nessuna differenza: le nuovi istruzioni assembler sono moooooolto specifiche, nel senso che servono per applicazioni estrememente complesse.

    Ad esempio:
    - istruzioni per il supporto alla memoria virtuale, usato dai sistemi operativi
    - istruzioni per il supporto di diversi livelli di protezione, usati nella realizzazione di sistemi operativi/driver
    - istruzioni per la crittografia, usati per la cifratura realtime del disco
    - istruzioni per il calcolo parallelo
    - istruzioni per il supporto alla codifica audio/video
    - ecc

    Eventualmente puoi trovare delle differenze se lavori ragionando a 8/16/32/64 bit.
  • Re: Linguaggio assembly

    Se hai un "clone" Arduino uno hai un chip 328p a 8bit
    È un chip relativente semplice da imparare ma sopratutto è documentato fino alla nausea, questo perché è un chip "vecchio" e in più usato da Arduino.
    Vai sul sito Atmel e cerca il 328p e scarica il suo datasheet, non ti passo il link diretto perché così ti diverti a scoprire il sito.
    Una volta che ne sei in possesso lo devi leggere tutto, oltre ad essere elencati i comandi in Assembly e i registri , ci sono anche alcuni esempi su come usarlo.

    In bocca al lupo.
  • Re: Linguaggio assembly

    Quasi dimenticavo, il datasheet del 328p può essere paragonato ad una pagina del datasheet di un Intel moderno.
Devi accedere o registrarti per scrivere nel forum
27 risposte